华中科技大学陶文兵教授2018年5月30日VALSE Webinar 成功举办。
陶文兵,教授,博士生导师,2004年12月在华中科技大学图像所获模式识别与智能系统专业工学博士学位,2013年11月晋升为教授,现为华中科技大学自动化学院图像识别与人工智能研究所/多谱信息处理技术国家级重点实验室/图像信息与智能控制教育部重点实验室教授/博士生导师。主要研究方向为图像分割,目标检测跟踪,大尺度三维重建,机器人目标识别与获取等领域。在国内外学术期刊和国际会议上共发表论文80多篇,SCI收录60余篇。2014年——2017年连续四年入选中国高被引学者(Most Cited Chinese Researchers)计算机领域。授权及申请发明专利30余项。
陶文兵教授Webinar的题目为:Efficient Large-Scale 3D Reconstruction.
在报告中,陶文兵教授首先回顾了三维重建在大多数计算机视觉中起着重要的作用。接着介绍整个三维重建流水线的三个核心步骤:GPU加速大规模图像匹配,从运动中提取大尺度结构,并进行多视图立体重建。首先,提出了一种基于GPU的级联哈希策略,极大地加快了图像匹配的速度。其次,介绍了一种用于大规模运动的三层重建算法。三重多路径重建树将图像集划分为适合重建的聚类,并找到多个可靠和稳定的起始点。这保证了场景总是从密集的地方重建到稀疏的区域,这可以减少错误积累时,图像有弱重叠。最后,提出了一种非对称棋盘传播和多假设联合视图选择的多视点立体方法(AMHMVS)。AMHMVS方法利用了非对称棋盘格传播,充分利用了GPU的大规模并行计算能力,进一步扩展了合理的假设,避免陷入局部最优。为了鲁棒地聚集匹配成本,使用多假设联合视图选择来构造成本矩阵,并启发式地推断每个像素的聚集视图子集。AMHMVS算法在ETH3D数据集上评测在1cm精度情况位列第1名,在其它精度下位列2, 3名,具体结果见https://www.eth3d.net/high_res_multi_view ,在Tanks and Temples (Intel)数据集上评测结果比第2名高出约11个百分点(AMHMVS评测结果是54.82,第二名是43.48),具体结果见:
https://www.tanksandtemples.org/leaderboard/ 。
问答部分:
问题1:陶老师的多张照片的重建问题与摄影测量中的前方交会算法有什么区别?
回答:本质上相同的原理,是不同学科的不同表达方式。
问题2:深度学习在本研究中的作用?
回答:深度学习是大数据无人机图片配准的一种新的有效算法,是很有前景的一类理论算法。
问题3:本研究中GPU加速的算法能否利用FPGA实现?
回答:多桢无人机图像的SIFT特征配准等应用中,GPU有着非常好的处理效率。在硬件配置受限的情况下,用FPGA实现是可行的。
录像视频在线观看地址:
http://www.iqiyi.com/u/2289191062
特别鸣谢本次Webinar主要组织者:
VOOC责任委员:杜博(武汉大学)
VODB协调理事:林倞(中山大学)
活动参与方式:
1、VALSE Webinar活动依托在线直播平台进行,活动时讲者会上传PPT或共享屏幕,听众可以看到Slides,听到讲者的语音,并通过聊天功能与讲者交互;
2、为参加活动,请关注VALSE微信公众号:valse_wechat 或加入VALSE QQ群(目前A、B、C、D、E、F、G群已满,除讲者等嘉宾外,只能申请加入VALSE H群,群号:701662399);
*注:申请加入VALSE QQ群时需验证姓名、单位和身份,缺一不可。入群后,请实名,姓名身份单位。身份:学校及科研单位人员T;企业研发I;博士D;硕士M。
3、在活动开始前5分钟左右,讲者会开启直播,听众点击直播链接即可参加活动,支持安装Windows系统的电脑、MAC电脑、手机等设备;
4、活动过程中,请不要说无关话语,以免影响活动正常进行;
5、活动过程中,如出现听不到或看不到视频等问题,建议退出再重新进入,一般都能解决问题;
6、建议务必在速度较快的网络上参加活动,优先采用有线网络连接;
7、VALSE微信公众号会在每周一推送上一周Webinar报告的总结及视频(经讲者允许后),每周四发布下一周Webinar报告的通知及直播链接。