何恺明、陈鑫磊最新研究:提出实例分割新方法TensorMask,效果比肩Mask R-CNN

2019 年 4 月 1 日 量子位
铜灵 发自 凹非寺
量子位 出品 | 公众号 QbitAI

何恺明大神的团队又有新研究了!

这一次,Facebook的陈鑫磊、何恺明等人,又从全新的角度,再次解决了实例分割任务中的难题:

他们提出一种通用的实例分割框架TensorMask,弥补了密集滑动窗口实例分割的短板。

在COCO数据集上进行测试实例分割结果可以发现,TensorMask的效果可以比肩Mask R-CNN。

这是种怎样的新方法?

4D张量

在论文TensorMask: A Foundation for Dense Object Segmentation中,研究人员详细介绍了通用框架TensorMask。

此前,实例分割的主流方法是Mask R-CNN。在这种方法中,模型先检测物体的边界框,然后进行裁剪和目标分割。

但是,密集滑动窗口的实例分割 (Dense Sliding-window Instance Segmentation)却鲜少被人关注。在这种方法中,每个空间位置的输出本身具有自己空间维度的几何结构,与Mask R-CNN有本质上的区别。

为了形式化说明这一方法,研究人员将密集实例分割看作是4D张量(4D tensors)上的预测任务,并提出通用框架TensorMask获取这种几何结构。

TensorMask的核心变化是,用结构化的高维张量表示一组密集滑动窗口中的图像内容。

TensorMask中包含两部分,一是预测蒙版的Head,负责在滑动窗口中生成蒙版,二是进行分类的Head,负责预测目标的类别。

两者分工明确,各司其职。

在COCO数据集上进行实例分割检测可以发现,TensorMask在test-dev上的平均精度达到了35.5,与Mask R-CNN的36.8非常接近。

结果证明,在定量和定性上,TensorMask均接近Mask R-CNN。

中国少年×2

这项新研究的背后,少不了中国研究人员的足迹。

论文一作是中国少年陈鑫磊,目前就职于Facebook,一路走来其研究经历闪闪发光。

陈鑫磊在浙江大学攻读计算机科学专业学习时,师从蔡登教授。本科毕业后奔赴CMU攻读博士,师从Abhinav Gupta教授,主要攻读计算机视觉方向。

在博士毕业前,陈鑫磊在Google Cloud AI部门实习过,当时在李飞飞和李佳两位大牛的项目组内。

在陈鑫磊的个人主页上可以看到,其参与过的多篇论文都被顶会接收。

三作何恺明大家应该不陌生,作为Mask R-CNN的主要提出者,何恺明三次斩获顶会最佳论文。

何恺明曾是广东高考状元,并保送了清华。本科毕业后,何恺明进入香港中文大学读研。期间继续在微软亚洲研究院参与研究,现也就职于Facebook。

论文的二作Ross Girshick和四作Piotr Dollar陈鑫磊和何恺明在Facebook的同事,顶会论文Mask R-CNN、Focal Loss for Dense Object Detection等,都是三人曾合作开展的研究。

有友如此,甚好甚好。

传送门

论文TensorMask: A Foundation for Dense Object Segmentation:
https://arxiv.org/abs/1903.12174

论文中表示,研究结果将于不久后开源~

值得期待。

量子位AI+系列沙龙--智慧城市

加入社群

量子位AI社群开始招募啦,量子位社群分:AI讨论群、AI+行业群、AI技术群;


欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“微信群”,获取入群方式。(技术群与AI+行业群需经过审核,审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点这里吧 !


登录查看更多
5

相关内容

深度学习目标检测方法及其主流框架综述
专知会员服务
143+阅读 · 2020年6月26日
【文献综述】深度学习目标检测方法及其主流框架综述
专知会员服务
114+阅读 · 2020年6月26日
CVPR 2020 最佳论文与最佳学生论文!
专知会员服务
34+阅读 · 2020年6月17日
专知会员服务
155+阅读 · 2020年4月21日
CVPR2020 | 商汤-港中文等提出PV-RCNN:3D目标检测新网络
专知会员服务
43+阅读 · 2020年4月17日
已删除
将门创投
8+阅读 · 2019年6月13日
学界 | Facebook、谷歌分别改进何恺明 FPN 工作
AI科技评论
11+阅读 · 2019年4月19日
Mask R-CNN 论文笔记
统计学习与视觉计算组
11+阅读 · 2018年3月22日
从R-CNN到Mask R-CNN
机器学习研究会
25+阅读 · 2017年11月13日
Mesh R-CNN
Arxiv
4+阅读 · 2019年6月6日
S4Net: Single Stage Salient-Instance Segmentation
Arxiv
10+阅读 · 2019年4月10日
Arxiv
5+阅读 · 2019年4月8日
TensorMask: A Foundation for Dense Object Segmentation
Arxiv
10+阅读 · 2019年3月28日
Few-shot Adaptive Faster R-CNN
Arxiv
3+阅读 · 2019年3月22日
Auto-Context R-CNN
Arxiv
4+阅读 · 2018年7月8日
Arxiv
19+阅读 · 2018年5月17日
Arxiv
7+阅读 · 2018年1月24日
VIP会员
相关资讯
已删除
将门创投
8+阅读 · 2019年6月13日
学界 | Facebook、谷歌分别改进何恺明 FPN 工作
AI科技评论
11+阅读 · 2019年4月19日
Mask R-CNN 论文笔记
统计学习与视觉计算组
11+阅读 · 2018年3月22日
从R-CNN到Mask R-CNN
机器学习研究会
25+阅读 · 2017年11月13日
相关论文
Mesh R-CNN
Arxiv
4+阅读 · 2019年6月6日
S4Net: Single Stage Salient-Instance Segmentation
Arxiv
10+阅读 · 2019年4月10日
Arxiv
5+阅读 · 2019年4月8日
TensorMask: A Foundation for Dense Object Segmentation
Arxiv
10+阅读 · 2019年3月28日
Few-shot Adaptive Faster R-CNN
Arxiv
3+阅读 · 2019年3月22日
Auto-Context R-CNN
Arxiv
4+阅读 · 2018年7月8日
Arxiv
19+阅读 · 2018年5月17日
Arxiv
7+阅读 · 2018年1月24日
Top
微信扫码咨询专知VIP会员