在刚刚过去的7月,CVPR 2017会议再次引爆全球学术注意力,本次会上论文收录数和参会人数双双刷新历史纪录。CVPR 的火爆,离不开中国学术军团的大力支持。国内CV从业者们在本次会上取得了优异的成绩,众多高质量的学术论文被收录。
为了让广大同学能够更加具体地了解CVPR 2017的学术成果,数据派联合科技媒体雷锋网于本周六下午在双清大厦举办“GAIR 大讲堂-CVPR清华专场”的论文分享活动。本次活动邀请了四位前方论文讲者为大家讲解CVPR收录论文以及他们的参会心得,其中一位讲者正是清华大学自动化系三年级博士生段岳圻同学,相信他们的分享将会对大家在顶会上投递学术论文起到直接的帮助作用。抓住暑期的尾巴,来享受这场学术饕餮大餐吧~
时间:8月19日下午14:00-18:30
地点:北京市海淀区双清路77号院双清大厦4号楼4层报告厅。(八家消防中队向北直行100米左转至77号院北门通行)
段岳圻
清华大学自动化系三年级博士生,指导老师为周杰教授和鲁继文副教授。他的研究方向在于视觉识别,二值特征学习和非监督学习。在此之前,他于2014年在清华大学自动化系获得学士学位。
主题:Learning Deep Binary Descriptor with Multi-Quantization (多量化深度二值特征学习)
分享内容:深度二值特征学习因其存储和匹配的高效性,近年来在学术界持续受到关注。现有的深度二值特征学习方法采用符号函数对实值特征进行二值化,未能考虑数据分布,从而导致了较大的量化损失。本文将二值化过程看作非监督多量化问题,提出了基于K-自编码网络的深度多量化算法,并将其应用于深度二值特征学习,提出了多量化深度二值特征学习,降低了二值化造成的量化损失。实验结果证明了本文方法的有效性。
孙刚
Momenta 研发总监、联合创始人、高性能并行计算系统专家、大规模图像识别专家、ImageNet 2017 图像分类冠军、ImageNet 2016 场景分类亚军、中科院大学计算机视觉专业博士。
主题:ImageNet冠军模型SE-Net详解
分享内容:作者提出了一种新颖的神经网络模块称为Squeeze & Excitation(简称SE),以此大幅提升模型的精度。通过Squeeze 和Excitation操作,SE模块自动对特征重新分配权重,增强对识别有用的特征,而抑制无效或收益甚微的特征。在引入极少计算和参数量的情况下,将现有绝大多数网络结构的性能大幅提升。
郑贺亮
中国科学技术大学电子工程与信息科学系一年级博士生,导师梅涛研究员和罗杰波教授。他的研究兴趣在于计算机视觉,机器学习。他于2017年在中国科学技术大学信息科学与技术学院获得学士学位,并于2016年7月到2017年7月在微软亚洲研究院实习。
主题:Look Closer to See Better: Recurrent Attention Convolutional Neural Network for Fine-Grained Image Recognition(精细化物体识别中基于递归注意力模型的卷积神经网络)
分享内容:基于弱监督的精细化物体识别问题近年来倍受关注。现存的主流方法分两种:对于有判别力区域的定位和对精细化特征的学习。在这篇CVPR文章里,作者通过设计一种RA-CNN的网络结构,将不同尺度的重要区域综合起来进行分类,实现了定位和精细化特征学习之间的相互促进,在精细化物体分类的任务上取得非常理想的结果。
邱钊凡
中国科学技术大学-微软亚洲研究院联合培养二年级博士生,导师为梅涛研究员和田新梅副教授。他的研究兴趣在于计算机视觉,机器学习和多媒体检索。他曾于2015年在中国科学技术大学获得学士学位,并长期在微软亚洲研究院实习。曾多次参与视频分类相关国际比赛并取得较好的成绩。
主题:Deep Quantization: Encoding Convolutional Activations with Deep Generative Model (基于深度生成模型的卷积层特征提取整合)
分享内容:深度卷积神经网络目前在不同的识别问题上体现出优异的性能,而如何从神经网络的卷积层中提取特征并做出整合分析成为了进行研究的一个基本问题。本文中提出了基于深度生成模型的卷积层特征的提取整合方案,并将最终得到的全局特征应用在不同分类问题当中。实验结果表明,在图片精细分类和视频动作识别两个问题上,该方法均体现出较好的性能。
福利:活动现场,主办方雷锋网将会送出5本《深度学习》书籍,精美奖品不容错过~
扫描下方二维码或点击文末“阅读原文”即可报名。
(本活动仅限报名参加,名额有限,抓紧报名呦!)
GAIR 大讲堂是雷锋网旗下高端AI行业分享活动品牌。通过邀请学术界、工业界嘉宾走进高校进行高质量内容分享,让广大同学们了解最前沿的学术与行业技术进展,实现学术界与工业界之间的深度交流。
CVPR(国际计算机视觉与模式识别会议)是IEEE 举办的年度学术性会议,也是计算机视觉的世界三大顶会之 一。会议主要关注计算机视觉与模式识别等方面的技术内容。在各种学术会议统计中,CVPR 有着非常强的影响力和高排名。今年的CVPR,也是迄今为止规模最大的一届。
公众号底部菜单有惊喜哦!
企业,个人加入组织请查看“联盟”
往期精彩内容请查看“号内搜”
加入志愿者或联系我们请查看“关于我们”
点击“阅读原文”报名