【导读】ShelfNet是一种高效的CNN模型,除了用于语义分割任务,它也可以用于姿态估计任务,并能与当前最佳的HRNet在MSCOCO数据集有相近的表现与3.5倍速度提升。
Github链接:
https://github.com/fmahoudeau/ShelfNet-Human-Pose-Estimation
ShelfNet框架
如上所述,ShelfNet使用ResNet主干,结合编码器/解码器分支。第一个编码器将信道复杂度降低了4倍,以加快推理速度。S块是具有权重的残差块,可显着减少参数数量。该网络使用跨步卷积进行下采样,并使用转置卷积进行上采样。该结构可以看作是FCN的集合,其中信息流经许多不同的路径,从而提高了准确性。
在MSCOCO数据集上的表现
下表列出了MS COCO KeyPoints数据集上ShelfNet50的测试结果,并与最新的HRNet进行了比较。所有实验都使用同一个人检测器,该检测器在COCO val2017数据集上的AP为56.4,输入图像的大小为256x192时,批处理大小为128;输入图像的大小为384x288时,批处理大小为72。
使用代码
# Train ShelfNet on COCO
python train.py --cfg coco/shelfnet/shelfnet50_384x288_adam_lr1e-3.yaml