今年同时出的yolox和yolof哪个性能更好 更值得一读呢?

关注者
32
被浏览
41,941
登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏

个人认为都值得一读,反正也不会花费多少时间,两篇论文而已。

因为YOLOX是yolo系列比较新的一个集大成者工作,最重要的一点是,它将yolo系列一直以来甩不掉的anchor box去掉了,这一点还是很不错的,尽管整体结构很像fcos,但无伤大雅,本就来不是为了提出一个新的检测器而发表的,同时也可以了解一下哪些trick比较好用,不妨用在自己的任务里。当然,这是一篇技术报告,所以不能对其有理论创新的要求。

YOLOF工作虽然不是sota ,但其意义就在于重新思考多级检测这个框架的必要性。虽然不免有些“开历史倒车”的成分,但对于已经根深蒂固的多级检测思想做一次挑战的勇气还是值得称赞。YOLOF也确实达到了很不错的性能,超过了RetinaNet。个人觉得YOLOF的形而上的意义要大于实际的应用价值,它主要还是探讨一些框架性的东西,其目的我想还是为了让人们重新思考一下:一定要多级检测吗?当然了,单级检测这之前就有了,比如centernet,最近的dynamic head 也是单级检测。只不过,yolof探讨的情况比较极端,用的是c5,且没有特征融合。当然,它也用了再大一点的c4。具体内容还请看论文吧,总的来说,框架很简洁,但个人觉得它没有解决它的motivation ,那就是在如此低分辨率的特征图上,不同尺度的物体信息究竟是怎么被提取出来的,尤其是小目标信息,又如何保证性能能大于retinanet 呢,换言之,dilated encoder 和uniform label assignment 两个策略感觉并不能很好的和motivation 契合上。当然,这是我个人之见,难免有失偏颇。