mooc.ai/bbs
(戳文末阅读原文直接进)
一个小介绍:
社区目前主要功能是问答和博客,支持文字、图片、视频、代码、公式、超链接,这些功能可以让你在描述问题 / 回答问题 / 写文章的时候用最清晰的方式来表达,还需要什么你说,我改。
如题。
来自社友的回答
▼▼▼
@玛希 • 加西亚
目标检测领域目前是两类和两段。
两大类,一类是 one-stage,一次得到结果的 YOLO 和 SSD。目前的 paper 都是基于 SSD 改进。
另一大类是 two-stage 的,分 2 次完成训练,其中另外一次是 RPN,做 region proposal。目前的 paper 都是基于 Faster RCNN 改进居多。
两部分网络是说一部分是 classify 的基础网络如 VGGNet、Mobilenet(也有叫 Bases、BackBone 或者 Meta-architectures),另外一部分就是 SSD、Faster RCNN 的 detection 部分。
性能真的很好吗?坑在哪里呢?
第一个问题,性能不好,可以去看各个 benchmark 的排名。coco 数据集为例,google models 下最好的是 faster_rcnn_nas,ap 是 42%,GPU 1060 上刚好 1 秒一帧。
第二个问题坑在哪里呢?
主流的发 paper 的捷径,speed 的角度:网络模型压缩,inference 加速,基础网络的优化。ap 提高的角度:multiple feature fusion,基础网络的优化。
当然也有何凯明大神的引入 focal loss 和 mask( segmentation)来提高 ap 的方法。
非主流的,anchor 的匹配模式真的好吗?多任务(分类和回归)快糙猛的组成 loss 去训练真的好吗?
新人福利
关注 AI 研习社(okweiwu),回复 1 领取
【超过 1000G 神经网络 / AI / 大数据,教程,论文】
如果你有更好的答案,点击阅读原文分享你的观点~
▼▼▼