四年一度的世界杯如约而至
然而今年的比赛却是冷门不断
德国、哥伦比亚等传统强队首战失利
巴西、阿根廷纷纷被逼平
葡萄牙队在C罗的加持下
“不败金身”能否延续大家拭目以待
而在刚刚过去的这几天
另一场“AI界的世界杯”也备受关注
全球计算机视觉顶级会议 IEEE CVPR 2018
在美国盐湖城举办
作为计算机视觉领域级别最高的研究会议
CVPR引领着全球计算机视觉最新的技术趋势
今年CVPR的热度更不输俄罗斯世界杯
大会吸引来自全球各地共 6512 人注册
赞助商及参展商数量更是高达149家
6月19日签到的人群就排起了大长龙
CVPR 2018签到现场
虽然中国队无缘俄罗斯世界杯,但在2018“AI界世界杯”上,中国的AI企业却是一支不容小觑的力量。今年,报名参加“AI界世界杯”的“投稿选手”高达3309篇,而正式被组委会接收,“成功晋级AI界世界杯正赛”的只有979篇,相比去年的783篇,增加了25%,比2016年多出52%,整体的论文接受率约为29%基本与去年持平。这979篇被接收论文,有70篇Oral(2.1%),224篇Spotlight(6.6%),以及685篇Poster(20.4%)。
本次CVPR 2018大会中国企业的论文数量为100篇左右,而在这些论文中商汤科技和联合实验室以44篇论文数量占据近半壁江山,是本次“AI界世界杯”当之无愧的明星选手,堪比足球场上的C罗。
带球过人:多项原创AI技术及解决方案亮相CVPR 现场人气爆棚
在CVPR 2018大会上,商汤完成了一次漂亮的“带球过人”,现场展示体验区为到场的嘉宾了展示了近几年来在AI行业落地的成果,场面十分火爆,备受关注。
SenseAR SLAM展示能实时重建现场,让虚拟3D动画角色出现在真实场景中,展台前,国产手游——王者荣耀AR版本一直吸引大家目光,原本只在手机上出现的李白、王昭君等王者,也在CVPR 2018的会场里一展“英雄本色“。
SenseAR SLAM现场体验者不断
SenseDrive DMS驾驶员监控系统,可针对驾驶员疲劳驾驶、驾驶分心、危险动作等驾驶员状态做到实时智能检测与提醒,为驾乘安全保驾护航。除此,在展示体验区,商汤的SenseAR Photo、SenseCity、SenseMe等AI技术及解决方案也纷纷亮相。
SenseDrive DMS驾驶员监控系统受到
加州大学伯克利分校教授马毅关注
通过视频捕捉并重构3D人脸以及表情信息,SenseMoji可以将表情转移到卡通形象,并驱动卡通形象完成指定的表情动画。现场的观众当即玩起了”动物世界“,灵动的狐狸、可爱的熊猫,完全被可爱的3D表情萌化了,这项技术也逐步应用于越来越多的手机厂商。
SenseMoji现场观众玩得不亦乐乎
狮子甩头:唯一入选Oral的中国企业
每年CVPR评选出的报告论文,都将代表着下一阶段计算机视觉领域的重要发展方向与突破。今年,商汤科技入选的44篇论文,在大规模分布式训练、人体理解与行人再识别、自动驾驶场景理解与分析、底层视觉算法、视觉与自然语言的综合理解、物体检测、识别与跟踪、深度生成式模型、视频与行为理解等领域实现突破。
在CVPR 2018首日,作为NITRE WORKSHOP赞助商之一,商汤科技研究院副院长、杰出科学家林倞代表商汤科技进行了“真·深度学习——当深度估计遇上深度学习”的主题分享。
林倞老师指出:深度信息在计算机视觉的各类应用中扮演着日益重要的角色。随着深度学习技术的发展,基于深度学习的深度估计方案已在学术界及工业界赢得广泛关注,无论是在基于双目还是单目摄像头的深度估计上,商汤科技均提出了新颖而有效的方案。
在双目深度估计方面,由商汤科技深度与运动组提出的级联残差网络曾在世界知名榜单KITTI上长期雄踞第一名。此外,为解决实际场景下缺乏监督数据的问题,又提出了“先放大、再学习”的自适应训练方案。在单目深度估计方面,传感器与算法组提出将其分解成视图合成与双目深度估计两个子问题并分别用不同的神经网络解决,从而获得了比拟双目深度估计的结果。目前,这些研究成果已支持多款手机的拍照产品,如vivo NEX、OPPO R15、OnePlus 6等。
一直以来,CVPR对Oral的审核都非常严苛,今年的CVPR仅有70篇Oral被接收。而商汤科技有3篇Oral入选CVPR 2018,是唯一入选Oral的中国企业。在商汤科技研究院副院长闫俊杰指导下,《Practical Block-Wise Neural Network Architecture Generation》第一作者钟钊向大会做了主题报告。
商汤科技研究院副院长闫俊杰指导的实习生钟钊
在CVPR大会上做主题报告
此论文提出了一种基于强化学习的网络结构自动设计算法,通过“网络块”的设计思想,让搜索空间大大降低,并且使设计的网络具有非常强的可迁移性。同时,论文使用“提前停止”和分布式架构来加速整个网络结构学习过程,达到了百倍于之前算法的速度(32块GPU,3天的训练)。实验表面,其生成的网络结构在CIFAR数据集上达到并且超越人类设计的网络结构的精度,并且其结构可以迁移到大规模的ImageNet数据上,取得良好的性能。
此外,商汤科技另有13篇论文获得了现场展示的机会,包括3篇Spotlight:《Single View Stereo Matching》、《Dynamic Scene Deblurring Using Spatially Variant Recurrent Neural Networks》、《High Performance Visual Tracking With Siamese Region Proposal Network》以及10篇Poster。
任意球破门:商汤Partytime 计算机视觉领域学者们在这里思想碰撞
作为本次AI世界杯的“明星选手”之一,Partytime沙龙活动也是本届CVPR商汤主办的亮点活动,在这里,计算机视觉领域的研究学者们同大家分享了最前沿的AI技术,现场吸引超过200人报名参与。
作为一家AI企业,本次活动签到采用了商汤自主研发的人脸识别技术,这可是在俄罗斯世界杯上看不到的哦。商汤科技联合创始人、香港中文大学-商汤科技联合实验室主任林达华、商汤研究院副院长林倞等从专业角度出发,各自表达了观点和看法,与到场的学者们进行了密切的互动交流。
从左到右依次为:商汤科技研究院副院长闫俊杰,香港中文大学-商汤科技联合实验室主任林达华,商汤科技研究院副院长林倞,悉尼大学教授欧阳万里
活动现场学者积极互动
商汤科技创始人、香港中文大学教授
汤晓鸥现场“神秘”压轴
鱼跃冲顶:IJCV盐湖城之夜 大佬们的饕餮盛宴
继CVPR 2017举办IJCV Asia Lobster Night之后,全球顶级计算机视觉期刊IJCV今年再次举办了IJCV Night-Salt Lake City(IJCV盐湖城之夜)主题活动。ECCV 2018大会主席Ramin Zabih,CVPR 2018程序委员会主席David Forsyth,加州大学伯克利分校教授马毅在IJCV主编汤晓鸥教授主动邀请下出席活动。另外还有Uber ATG负责人、多伦多大学教授Raquel Urtasun,本田研发总工程师Yuji Yasui及汤晓鸥教授本人,一共六位计算机视觉领域的专家在晚宴上发表精彩演讲。
今年的IJVC盐湖城之夜,香港中文大学-商汤科技联合实验室主任林达华教授从汤晓鸥教授手中接过“交接棒”,担任整场活动的主持人。Ramin Zabih和David Forsyth两位大佬作为本次晚宴的开场嘉宾进行了发言,David教授还提出:资深的教授和计算机视觉专家在学术界更能够发挥使命价值,推动业界的发展。
阿里巴巴iDST首席科学家和副院长任小枫、阿里巴巴人工智能实验室首席科学家王刚、OPPO研究院院长刘畅等行业重磅大咖也作为赞助商代表出席,并共同探讨AI技术发展趋势以及打造产业化平台,共建AI新生态的愿景。
本届IJCV Night逾350人参加交流分享,是整个CVPR大会期间最为关注和瞩目的学术交流盛会。前来到场的学者和观众给予活动高度评价,无论从演讲嘉宾、与会来宾及晚宴的规格等,可谓CVPR期间的顶配。很多国内外AI公司的学术和技术带头人也前来参加IJCV Night,与学术界大佬、业界大腕儿度过了难忘的夜晚。
IJCV Night开始前参会者场外签到
ECCV 2018大会主席Ramin Zabih
CVPR 2018程序委员会主席
David Forsyth
加州大学伯克利分校马毅教授就“从技术角度客观分析,我们离真正的AI有多远”也分享了自己的看法,马毅教授也将通过这次的分享为起点,不断充实和完善这一思考,或许在不久的将来,我们就可以看到马毅教授的深度观点。
加州大学伯克利分校教授马毅
Uber ATG负责人、
多伦多大学教授Raquel Urtasun
本田研发总工程师Yuji Yasui
IJCV主编、商汤科技创始人
香港中文大学教授汤晓鸥
CVPR 2018大会已经落下帷幕,不过还好,相较于四年一度的足球世界杯,这场AI界的世界杯每年都有,商汤科技的微信订阅号已经分享了多期CVPR 2018成果,如果说等不及CVPR 2019大会的到来,意犹未尽的同学们不妨先回顾下CVPR 2018 商汤论文解读吧。