新智元报道
来源:CVPR官网
作者: 弗格森 刘小芹
【新智元导读】 CVPR 2017近日公布783篇接收论文名单,现在所有的论文名单已经可以看到。新智元经过简单统计后发现,华人学者被接收的论文数量已经超过了45%。另外,在全部81名CVPR2017主席的名单中,我们看到了张正友、陈熙霖、华刚、贾佳亚、孙剑、吕乐、周少华、朱松纯等多位老师的名字。微软全球执行副总裁沈向洋将发表主旨演讲,我们带来了简单的内容介绍。企业参与上,除了BAT以外,今年的CVPR上涌现了大量的国内创业公司,一起来看看都有哪些。
市场研究&咨询公司Grand View Research的一份研究报告显示,在深度学习领域,2016年,图像识别主导了应用程序领域,获得了40%多的市场份额。这种火热现象也直接在学术研究领域得到了反应——即将于7月21日在26日在夏威夷举行的CVPR获得了极大的关注。
会议官方网站最新的数据显示,今年,CVPR 共收到2680有效投稿,一共有783篇论文被接收。
官方还没有公布本年度的参会人数,但是2016年的数据显示,去年CVPR总共参会人数3600人,其中有34.35%是学术,28.62%学术界,37.03%来自产业界。
同样是在官方宣布的数据中,我们看到,2017年产业界的参与数量众多,全球共有约90家企业参与到本次大会中。除了大家熟知的谷歌、微软、Facebook、亚马逊、苹果、英特尔、英伟达巨头,中国的腾讯、阿里巴巴、京东、滴滴等大型互联网公司,还有众多初创企业,比如驭势、格灵深瞳以及Momenta等等。
今年,CVPR 共收到2680有效投稿,其中2620篇经过完整评议(其余60篇有一些是出于技术或伦理方面的原因被委员会拒绝,有一些则在评议前退出)。
最终,一共有783篇论文被接收(接收率为29%)。其中有71篇获得长篇口头报告的展示机会,144篇获得短报告(spotlights)的机会。
CVPR 2017的接收论文有三种展示形式:两种形式的口头展示(长篇与短篇,即Oral 与 Spotlights),以及海报展示。新智元统计发现,大会一共有107个Session。
ORALS:与传统的CVPR orals 一样,CVPR 2017 上进入 orals 环节的论文数量比例与此前几届CVPR一致。每一个orals 报告的时间是12分钟。
SPOTLIGHTS: 每一个spotlight的报告者有4分钟的口头报告时间,来强调论文的主要贡献和创新之处,以及报告论文的主要研究成果。
POSTERS: 口头报告之外的论文将会得到海报展示的机会。此外,所有的口头报告之外的论文也会出现在接下来的海报展示环节中。
全部论文名单地址:http://www.cvpapers.com/cvpr2017.html
统计部分截图
经过新智元的统计,全部 783 篇论文中,华人学者参与并署名的论文约为356篇,占比45.47%。(新智元同学人眼统计,可能会存在微小误差)
1. James J. DiCarlo 博士,MIT
演讲题目:自然智能(NI)科学:灵长类动物视觉感知的反向工程
摘要:神经科学和认知科学的一大难题是人类思维的反向工程。与其他科学领域相比,这个领域仍处于起步阶段。旨在模拟人工系统里的人类智能(AI)的正向工程方法也还是起步阶段。但是,在人类行为中显见的智能和认知的灵活性是存在的证据,证明机器可以被设计来模仿人类思维并与人类一起工作。在这个演讲中,我将提出,通过结合脑科学和认知科学家的研究(生成和数据采集),以及旨在模拟思维(实例化和数据预测)的正向工程,思维的反向工程可以解决。为了支持这个论点,我将重点关注感知智能(对象分类和检测),我将讲述脑科学,认知科学和计算机科学中如何融合以创造可以支持这些任务的深层神经网络。这些网络不仅在图像任务上达到人类的表现,而且它们的内部运作机制也大量模拟理论灵长类动物视觉系统的内部机制。但是,灵长类视觉系统(NI)表现仍然超出当前的深度神经网络(AI),我将展示一些神经科学方面的新线索。更广泛地说,这只是这一伟大人类科学追求的开始——理解自然智能,我希望激励更多人与我们一起参与这一领域。
2. 沈向洋博士,微软全球执行副总裁
计算机视觉的商业化:成功故事和经验教训
摘要:对于所有的计算机视觉研究者和实践者来说,这是一个令人兴奋的时代。我们已经看到,将多年的技术进展转化为市场化技术这一方面获得了空前增长。微软多年以来一直致力于开发新的计算机视觉技术,向所有的开发者开放,并把它们融入各种产品当中。
在这一研究中,我将会简单地回顾计算机视觉在微软研究院过去25年的研究历史,强调微软研究院对计算机视觉领域的贡献,并且着重介绍长期投入在企业中成功打造产业研究院的重要意义。
在介绍微软商业化的成果之前,我还会介绍一些我们在计算机图学、图学理解、视觉和语言等方面的最新研究成果,具体地,我将介绍微软在开发三款产品上的经验:微软Pix,HoloLens和认知服务,三者分别以不同的方法在利用计算机视觉系统和技术。
Pix 是一个基于AI的照相APP,它会让你更轻松有趣地拍出“伟大的照片”,“聚焦、拍照、完美!”它融合了微软研究院几十个CVPR、ICCV和SIGGRAPH的研究成果。HoloLens是市场上第一个商业可用的混合现实系统。认知服务则能让你在只使用几行代码的情况下,在不同的设备和平台上,搭建起基于AI的、实用的APP。
在本次演讲中,我讲展示IRIS,这是一个交互式的视觉学习服务,让开发者可以创建图像识别应用程序。我还将展示一些关于HoloLens最新的demo,其中包括Holoportation 项目。Holoportation 是一个新的3D捕捉技术,允许对高质量的人物3D模型进行重建、压缩和变换,随时随地都能进行。推动从研究到产品循环,其中有不少挑战。我讲会讨论,从生产Pix, HoloLens 和 认知服务中所获得的经验。
3. Dan Jurafsky, 博士, 斯坦福大学
从语言中提取社会意义
我会在大会上介绍我们实验室在计算机从语言中提取社会意义的研究,也就是考虑人与人之间的社交关系的研究。
我们研究了在交通信号灯前,经常和社区成员之间的互动情况。我们自动地测量了语言交互的质量,研究了交流过程中种族的角色,并未这一领域的一些未来研究提供了建议。
另一方面,我们将科学论文的语言与由科学家及其研究领域组成的网络进行计算建模,以更好地了解科学创新进展情况以及跨学科的作用。我将上述研究对科学史,特别是人工智能的影响。这两项研究都强调了社会语境和社会模式在解释我们使用的词语背后潜在含义的重要性。
CVPR 2017 共设置有大会主席、程序主席、Workshop主席、Corporate主席、Doctoral Consortium主席、Finance主席、学生志愿者主席、技术主席、出版主席和领域主席等。共有81位主席,其中华人学者人数在30位左右。
根据视觉求索的介绍,CVPR 大会领域主席(Area Chair or AC)是由大会程序主席指定的。Area Chair起着极其重要的作用,某种程度上具有投稿的直接“生杀大权”。因此,Area Chair一般都是领域内颇有建树的专家学者。
我们主要介绍在本次大会上担任主席的华人学者们:
大会主席
张正友 (微软)。张正友博士是世界著名的计算机视觉和多媒体技术的专家,是ACM Fellow和IEEE Fellow。他在立体视觉、三维重建、运动分析、图像配准、摄像机自标定等方面都有开创性的贡献。目前,正从事人机交互和远程实景临场等领域的一些核心技术研究。他发明的平板摄像机标定法在全世界被普遍采用,被称之为“张氏方法”。
程序主席
刘燕西(宾夕法尼亚州立大学)
吴郢(西北大学)
Workshop 主席
陈梅(奥尔巴尼大学)
Corporate Relations Chairs
颜水成(奇虎360)
韩玫(Google)
Demos Chair
吕乐(NIH)
Website Chair
袁浚菘(南洋理工大学)
Publicity Chair
龚怡宏(西安交通大学)
领域主席
陈熙霖(中国科学院)
华刚(微软亚洲研究院)
贾佳亚(香港中文大学)
李伏欣(俄勒冈州立大学)
刘策(Google)
刘小明(密歇根州立大学)
刘自成(微软研究院)
吕乐(NIH)
罗杰波(罗彻斯特大学)
史建波(宾夕法尼亚大学)
孙剑(微软亚洲研究院)
田奇(圣安东尼奥得克萨斯大学)
王井东(微软亚洲研究院)
王晓刚(香港中文大学)
吴建鑫(南京大学)
杨睿刚(肯塔基大学)
尹朝征(密苏里科技大学)
虞晶怡(特拉华大学 / 上海科技大学)
袁浚菘(南洋理工大学)
张察(微软研究院)
周少华(西门子企业研究所)
朱松纯((UCLA))
大会白金赞助商(除了常见的谷歌、微软、Facebook、亚马逊、苹果、英特尔、英伟达等国际巨头,我们看到中国的腾讯、阿里巴巴、京东、滴滴和驭势、格灵深瞳以及Momenta。
大会金牌赞助商
大会银牌赞助商
铜牌赞助商
初创企业赞助商
其他赞助商