来源:机器学习研究学会订阅号
【导读】目标分类和目标检测都是目前计算机视觉领域使用较为广泛的技术。对许多实际应用,如自动驾驶、安防监控等,目标分类和检测是核心的算法。本文介绍来自纽约城市大学的83页《目标分类和目标检测综述》,该论文综述了2D和3D场景下的目标分类和检测技术。
目标分类和目标检测都是目前计算机视觉领域使用较为广泛的技术。对许多实际应用,如自动驾驶、安防监控等,目标分类和检测是核心的算法。深度学习的出现,使得目标分类和检测技术有着革命性的突破。对于实际应用来说,目标分类和检测仍面临着性能和效率的挑战。
来自纽约大学的《A survey of Object Classification and Detection based on 2D/3D data》()介绍了2D和3D场景下的目标分类和检测技术。目录大致如下:
简介
基于2D图像的系统
高阶主要任务
图像分类的主要网络
目标检测
边界框(Bounding Box)编码方法
2阶段系统(RCNN、Fast RCNN、Faster RCNN)
1阶段系统(YOLO、YOLOv2)
基于2D的方法的总结
语义分割
Mask R-CNN
基于3D图像的系统
主要高阶任务
3D图像数据表示
分类
ModelNet40排行榜
CAD分类输入
MVCNN
RotationNet
PointNet
检测
3D目标检测数据集
检测输出
阶段数量对比
3D边界框(Bounding Box)编码方法
基于输入数据、特征表示、边界框编码方法和卷积核的对比
性能对比
应用场景对比
室内场景
户外场景
户外和室内场景
3D系统的数据表示方法总结
总结
附论文内容截图:
参考链接:
https://arxiv.org/abs/1905.12683
☞ OpenPV平台发布在线的ParallelEye视觉任务挑战赛
☞【学界】OpenPV:中科院研究人员建立开源的平行视觉研究平台
☞【学界】ParallelEye:面向交通视觉研究构建的大规模虚拟图像集
☞【CFP】Virtual Images for Visual Artificial Intelligence
☞【最详尽的GAN介绍】王飞跃等:生成式对抗网络 GAN 的研究进展与展望
☞【智能自动化学科前沿讲习班第1期】王飞跃教授:生成式对抗网络GAN的研究进展与展望
☞【智能自动化学科前沿讲习班第1期】王坤峰副研究员:GAN与平行视觉
☞【重磅】平行将成为一种常态:从SimGAN获得CVPR 2017最佳论文奖说起
☞【学界】Ian Goodfellow等人提出对抗重编程,让神经网络执行其他任务
☞【学界】六种GAN评估指标的综合评估实验,迈向定量评估GAN的重要一步
☞【资源】T2T:利用StackGAN和ProGAN从文本生成人脸
☞【学界】 CVPR 2018最佳论文作者亲笔解读:研究视觉任务关联性的Taskonomy
☞【业界】英特尔OpenVINO™工具包为创新智能视觉提供更多可能
☞【学界】ECCV 2018: 对抗深度学习: 鱼 (模型准确性) 与熊掌 (模型鲁棒性) 能否兼得