超越微软、Google、Facebook ! 旷视科技研究院包揽 COCO、Places 三项世界冠军

2017 年 10 月 30 日 机械鸡 旷世科技

当地时间10月29日上午,在意大利威尼斯召开的计算机视觉国际顶级会议 International Conference on Computer Vision(ICCV 2017)的 “Joint COCO and Places Recognition Challenge” Workshop 中公布了 COCO 及 Places 竞赛排名情况。


在共七项挑战项目中,旷视科技研究院团队(Megvii)参与了其中最重要的四项,并获得了三项第一、一项第二的优异成绩,一举击败了来自微软、Facebook、Google、商汤科技等企业,以及卡内基梅隆大学、北京大学、香港中文大学、上海交通大学等高校的竞争者,成为了第一个在 COCO 竞赛中获得冠军的中国企业。


COCO Challenges Ranking Result


MS COCO (Microsoft Common Objects in Context,常见物体图像识别) Challenge 是继 ImageNet(已停办)之后,计算机视觉领域最受关注和最权威的比赛之一,是图像(物体)识别方向最重要的标杆(没有之一),也是目前国际领域唯一一个能够汇集 Google、Microsoft、Facebook 三大巨头,国际顶尖院校以及优秀创新企业共同参与的大赛。


与关注整体图像的 ImageNet 图像分类任务相比,COCO 中的物体检测任务更关注的是图像中出现的每个物体的个体(比如各种小物体,各种遮挡物体),因此要求算法对图像细节有更好的理解。这个比赛也代表了继 ImageNet 后的图像识别的最高水平。


旷视科技Face++参赛团队


COCO 从2015年开始举办,至今已经三届,前两届物体检测冠军分别是 MSRA 和 Google。今年的 COCO 包含四个 Task:  Detection Challenge(物体检测)、Instances segmentation(物体分割)、(Human) Keypoint Challenge(人体关键点检测)、Stuff Segmentation(背景语义分割)。


其中旷视科技Face++团队参与了前三项任务的挑战,并取得了两项第一(物体检测、人体关键点),一项第二(物体分割)的杰出成绩。



而 Places 是由 MIT 和 CMU 等高校牵头,在今年新设立的一项旨在深度理解图像场景的国际级计算机视觉类竞赛,今年与 COCO 联合举行。Places 2017 共设有三个任务:Scene Parsing(场景分割)、Instance Segmentation(物体分割)、Semantic Boundary Detection(边缘检测)。


旷视科技Face++团队只参与了其中物体分割的挑战,并击败了主要竞争对手 Google,赢得了该任务的冠军。




而对于产业界来说,机器对于人体、物体和场景的理解十分重要。此次旷视研究院在 COCO  和 Places 竞赛中的成绩足以印证旷视科技在全球范围内的技术领先性。利用具有竞争力的技术优势,旷视研究院与产品中心将持续在产品开发中共同推进技术转化,展开行为识别、场景分割、物体检测和物体分割等技术在互联网金融、智能安防、城市大脑、新零售、手机等实用场景或行业中的应用探索,以实现技术价值最大化。


旷视科技首席科学家、研究院院长孙剑表示,这次旷视科技能够一举在这个竞争最激烈的比赛中,第一次代表中国企业拿到分量最重的三项冠军,主要依赖三个法宝:


  • 旷视拥有自研并全员使用的深度学习引擎 MegBrain,它使我们可以以最快的速度系统化训练算法;


  • 旷视研究院拥有对深度学习和计算机视觉算法长期而深入的研究积累。虽然旷视很少在国际数据集竞赛上“刷榜”,但其实内部的技术指标一直都非常高,借这次机会拿出来和大家分享一下;


  • 旷视研究院除了拥有充沛的计算资源,更重要的是拥有一个鼓励不断高速创新的环境、和追求极致的文化。


推荐阅读

训练一辆无人车,到底需要多少数据?

全球首支AI基金:365天无间断工作

马斯克OpenAI实验室的17岁高中生

细数李彦宏的40位“出走门徒”

苹果AI人才报告:斯坦福等名校被挖空

Airbnb使用AI技术 让设计图秒变代码

被新浪科技的编辑套路后

清华大学计算机专业排名全球第一

深度学习库大排名:TensorFlow第一

谷歌中国首席工程师详解TensorFlow


长期招聘志愿者

加入「AI从业者社群」请备注个人信息

添加小鸡微信  liulailiuwang


登录查看更多
0

相关内容

北京旷视科技有限公司由印奇、唐文斌、杨沐三人2011年创办于北京市海淀区中关村, 致力于打造服务于各商业领域的AIoT操作系统,以及构建具备连接物联网设备能力的生态系统。 在北京、上海、深圳、成都、南京、杭州、武汉、宁波、青岛、徐州、美国西雅图等地设有研发中心和运营机构。 官方网站:https://www.megvii.com/
CVPR 2020 最佳论文与最佳学生论文!
专知会员服务
35+阅读 · 2020年6月17日
专知会员服务
109+阅读 · 2020年3月12日
漫谈全景分割
PaperWeekly
11+阅读 · 2019年3月14日
旷视COCO2018 Keypoint冠军算法详解
极市平台
5+阅读 · 2019年1月10日
ECCV 2018 | 10篇论文+5项第一,记旷视科技ECCV之旅
机器之心
5+阅读 · 2018年9月14日
【消息】自动化所获计算机视觉大会ICCV2017场景解析竞赛冠军
中国科学院自动化研究所
5+阅读 · 2017年11月6日
TensorMask: A Foundation for Dense Object Segmentation
Arxiv
10+阅读 · 2019年3月28日
Panoptic Feature Pyramid Networks
Arxiv
3+阅读 · 2019年1月8日
Arxiv
6+阅读 · 2018年6月21日
Arxiv
5+阅读 · 2018年4月17日
Arxiv
7+阅读 · 2018年1月24日
Arxiv
3+阅读 · 2017年11月21日
VIP会员
相关资讯
相关论文
TensorMask: A Foundation for Dense Object Segmentation
Arxiv
10+阅读 · 2019年3月28日
Panoptic Feature Pyramid Networks
Arxiv
3+阅读 · 2019年1月8日
Arxiv
6+阅读 · 2018年6月21日
Arxiv
5+阅读 · 2018年4月17日
Arxiv
7+阅读 · 2018年1月24日
Arxiv
3+阅读 · 2017年11月21日
Top
微信扫码咨询专知VIP会员