年度订阅用户可加入科技英语学习社区,每周科技英语直播讲堂,详情查看“阅读原文”
10 月 26 日,人工智能领域又曝出了一条大新闻:中国人工智能独角兽企业商汤科技与香港中大-商汤科技联合实验室在水城威尼斯 ICCV 有 20 篇论文入选,其中包括 3 篇 Oral(录取率仅 2.09%)和 1 篇 Spotlight,领先于 Facebook(15 篇)、Google Research(10 篇)等科技企业。
DT君从商汤科技获悉,本次20篇论文可分为四条主线,分别为:
跨模态分析——让视觉与自然语言联合起来;
视频分析——让计算机看懂视频;
生成对抗网络——让计算机学习创作;
以及一些重要的核心领域,包括人脸检测、物体检测、人体姿态估计、实际场景中的身份再识别等。
其中前三个方向均为新兴研究方向,打破了传统视觉任务的藩篱,突破了计算机视觉的瓶颈。其中不乏在消费领域具有巨大的应用价值,也可以通过产生训练样本的方式反哺传统领域的研究。
而这也是商汤科技继 7 月份夏威夷 CVPR 以 23 篇论文夺得桂冠之后取得的又一佳绩。而在经过今年 CVPR 和 ICCV 这两大全球顶级视觉学术会议之后,商汤科技以 43 篇的论文发表量高居亚洲第一。过去的两年,在 CVPR、ICCV 和 ECCV 全球三大计算机视觉顶级会议上,商汤科技与香港中大-商汤科技联合实验室发表的论文数量高达 76 篇,超过加州大学伯克利分校、斯坦福大学、麻省理工学院等国际名校及 Google、Facebook 等国际巨头。
ICCV 的全称是“ International Conference on Computer Vision”,即国际计算机视觉大会,由 IEEE(美国电气和电子工程师协会)主办,与计算机视觉模式识别会议 (CVPR) 和欧洲计算机视觉会议 (ECCV) 并称计算机视觉方向的三大顶级会议。其中,ICCV 论文由于录用率非常低,是三大会议中公认级别最高的。
而在数次比赛中,新人的表现可谓着实亮眼。商汤科技的实习生刘枢在 ICCV 期间举办的 MS COCO(Microsoft Common Objects in Context,常见物体图像识别)Workshop 上,摘取了两项比赛的一个冠军(Segmentation)及一个亚军(Detection)。在 Keypoint Challenge 上商汤科技另一组实习生也取得了单模型的最高识别率,整体性能第二的好成绩。仅靠单一模型就接近多模型的融合结果,由于计算复杂度的限制,在工业应用中单模型更具实用价值。
此前,商汤科技的实习生刘枢、潘新钢、李晓潇、张熠还在 7 月举办的 CVPR 期间摘取了四项赛事的桂冠,包括视频分割领域最具权威的 DAVIS 视频分割竞赛、北美著名高校和自动驾驶团队组织的图森杯车道线识别竞赛、著名国际自动驾驶组织 Mappillary Research 和普林斯顿大学组织的 LSUN17 大规模街景场景理解竞赛-语义分割及物体分割竞赛,这些技术未来可以广泛应用在自动驾驶等领域,具有非常强的实用性。
而在获奖的背后则是华人在 AI 领域地位的崛起。数据显示,中国学者发表的关于深度学习的期刊论文数量已超过美国。此次 ICCV 会议上,中国企业的整体表现强劲,根据组委会公开的数字,今年接收论文中,有 40% 的第一作者都是华人。同时在会议的厂商展区中,也有大量中国企业的展位。
业内人士分析认为,以商汤科技为代表的中国人工智能学术研究力量已经崛起。当然,要推动人工智能的发展,除了发展基础研究,还要与实际应用场景紧密结合。大学的研究教育,也需要与企业一起联合,学术界与工业界的真正融合才能引发新一轮产业变革。
而今年有学术成果入选 ICCV 的中国企业包括(不完全统计):
商汤科技。商汤科技与香港中大-商汤科技联合实验室在 2017 年的 ICCV 共发表了 20 篇论文,其中包括 3 篇 Oral(录取率仅 2.09%)和 1 篇 Spotlight,领先于 Facebook(15 篇)、Google Research(10 篇)等科技巨头。
腾讯。腾讯优图团队共有 12 篇论文入选 2017 年的 ICCV,其中 3 篇被选做口头报告(Oral),该类论文占总投稿数的 2.1%(45/2143)。
阿里巴巴。阿里 iDST 与多家机构合作的多篇研究““视觉-语义联合嵌入 (Visual-SemanticEmbedding)”和““跨模态检索 (Cross-mediaRetrieval)”的论文入选。
ADAS(辅助驾驶系统) 创企 MINIEYE。其首席科学家吴建鑫所在团队的《ThiNet: 一种用于深度神经网络压缩的滤波器级别剪枝算法》被 ICCV 2017 收录。
AR 公司亮风台。其论文“Parallel Tracking and Verifying: A Framework for Real-Time and High Accuracy Visual Tracking.”及“Saliency Pattern Detection by Ranking Structured Trees. ”入选 ICCV 2017。
-End-