◆ ◆ ◆ ◆
学科前沿讲习班
The CCF Advanced Disciplines Lectures
CCFADL第93期
主题 计算机视觉
2018年10月29-31日
北京中科院计算所一层报告厅
◆ ◆ ◆ ◆
扫描二维码报名
计算机视觉是当前人工智能的重要研究领域之一,并已成为人工智能应用的重要手段。鉴于计算机视觉近期的蓬勃发展,本期讲习班围绕计算机视觉的热点,讲授当前计算机视觉的前沿最新进展。本讲习班旨在帮助学员从中快速学习当前计算机视觉的热点和前沿技术,了解学科发展动向和重要的应用方法,开阔科研视野,增进学术交流和增强实践能力。
本期CCF学科前沿讲习班《计算机视觉》邀请到了计算机视觉重量级的专家学者做主题报告。他们将对计算机视觉的基础算法、关键技术方法以及当前热点问题进行深入浅出的介绍,并对如何开展本领域前沿技术研究等进行探讨,使参加者在了解学科热点、提高理论水平的同时,掌握最新技术趋势。
学术主任:王亮 中科院自动化所
郑伟诗 中山大学
主办单位:中国计算机学会
活动日程:
特邀讲者
上海科技大学教授
虞晶怡
讲者简介:虞晶怡,2000年获美国加州理工学院(Caltech)应用数学及计算机科学双学士学位,2005年获美国麻省理工学院(MIT)计算机与电子工程博士学位。自2005年起,先后任美国特拉华大学助理教授、副教授和正教授,现任上海科技大学信息科学与技术学院正教授、副院长。虞教授长期从事计算机视觉、计算成像、计算机图形学、生物信息学等领域的研究工作,已发表120多篇学术论文,其中超60篇发表于国际会议CVPR/ICCV/ECCV和期刊TPAMI上。他的研究获得美国自然科学基金会、美国国立卫生研究院、美国陆军研究所以及美国空军科学研究所等机构资助。虞教授是美国国家科学基金杰出青年奖(NSF CAREER Award)获得者。他曾担任CVPR/ICCV/ECCV/ICCP/NIPS等多个人工智能国际顶级会议的程序主席、领域主席。现为三个国际顶级期刊IEEETPAMI、IEEETIP、Elsevier CVIU的编委。虞教授将担任人工智能顶会ICPR2020和IEEECVPR2021的大会程序主席。
报告题目:Learning to Build a New Reality
摘要:There have been tremendous advances on applying deep learning techniques for 2d image understanding. In contrast, very little work has focused on employing deep learning for modeling datasets beyond 2D such as 3D geometry and 4D light fields. In this talk, I present several latest works from our group on in this exciting new arena, with a focus on their applications to virtual and augmented reality and computational photography. I first present a novel deep surface light field (DSLF) technique. A surface light field represents the radiance of rays originating from any points on the surface in any directions. Traditional approaches require ultra-dense sampling to ensure the rendering quality. Our DSLF works on sparse data and automatically filling in the missing data by leveraging different sampling patterns across the vertices and at the same time eliminates redundancies due to the network's prediction capability. For real data, we address the image registration problem as well as conduct texture-aware remeshing for aligning texture edges with vertices to avoid blurring. Next, I present an end-to-end deep learning scheme to establish dense shape correspondences and subsequently compress 3d dynamic human bodies. Our approach uses sparse set of “panoramic” depth maps or PDMs, each emulating an inward-viewing concentric mosaics (CM). We then develop a learning-based technique to learn pixel-wise feature descriptors on PDMs. The results are fed into an autoencoder-based network to achieve ultra-high compression ratio.
旷视科技(Face++)首席科学家
孙 剑
讲者简介:孙剑博士,旷视科技(Face++)担任首席科学家、旷视研究院院长。孙剑博士毕业于西安交通大学,毕业后加入微软研究院,任至首席研究员。其主要研究方向是基于深度学习的图像理解、人脸识别、和计算摄影学,在顶级学术会议和期刊上发表论文100余篇,谷歌学术引用55,000余次,H-index达75,其中11篇引用超过1000。拥有国际或美国专利35项。2009和2016年两次获得CVPR最佳论文奖,曾担任ICCV2011,CVPR2014-2017的领域主席。2010年被MIT Technology Review评选为“全球35岁以下杰出青年创新者”。2015年获得ImageNet和COCO图像识别五项冠军,2016年获得国家自然科学二等奖,2017年获得COCO&Places图像理解大赛三项冠军,2018年获得COCO&Mapillary图像大赛四项冠军。他领导研究的“ResNets”、“FasterRCNN”、“ShuffleNet”等技术目前被广泛应用在学术和工业界。
报告题目:云、端、芯上的视觉计算
摘要:越来越大和越来越深的神经网络不断降低识别错误率,甚至在不少语音和图像识别任务上超过了人类。但是这些深度网络也对计算提出了新的要求和挑战:在很多视觉应用场景中,我们需要在不同的计算平台上最大化推理算法的性能。在这个报告,我将介绍一系列我们的近期分别针对云、移动端、芯片的深度神经网络设计工作,包括ResNet,ShuffleNet,DorefaNet等,以获得最佳的识别精度。同时也会介绍一些旷视科技在云、端、芯等应用场景的人工智能实践。
中国科学院计算技术研究所研究员
山世光
讲者简介:山世光,中科院计算所研究员、博导,现任中科院智能信息处理重点实验室常务副主任。他的研究领域为计算机视觉和机器学习,在人脸识别等图像识别技术上有超过20年的研发经验,带领团队获得过十余次国内外学术竞赛冠亚军,所研发的人脸识别技术成功应用于公安部出入境管理局、十几省公安厅、多款华为手机等。已在国内外刊物和学术会议上发表论文300余篇,其中CCFA类论文70余篇,论文被谷歌学术引用14000余次。曾应邀担任(过)ICCV,CVPR,ACCV,ICPR,FG,ICASSP等10+次领域主流国际会议的领域主席,现/曾任IEEETIP,CVIU,PRL,Neurocomputing,FCS等国际学术刊物的编委(AE)。研究成果获2005年度国家科技进步二等奖,2015年度国家自然科学二等奖。
报告题目:后深度学习时代的视觉计算模型与方法
摘要:近年来,得益于有效利用大规模强监督样本的深度神经网络,计算机视觉和模式识别在诸多任务上取得了跨越式的进步,然而大量现实的问题都难以获得大规模强监督样本,因此弱监督、小样本等复杂数据条件下的机器学习研究具有重要理论和应用价值。本讲座将在回顾深度学习视觉计算总体进展及落地困难的基础上,讨论后深度学习时代计算机视觉领域需要解决的一些关键挑战,特别是在复杂数据条件下的视觉学习问题,并介绍在这些视觉问题上的若干近期研究进展。
中科院深圳先进技术研究院研究员
乔 宇
讲者简介:乔宇,研究员,中科院深圳先进技术研究院集成所副所长,广东省机器视觉与虚拟现实重点实验室常务副主任。入选科技部中青年科技创新领军人才、是广东省科技创新领军人才、深圳鹏程学者长期特聘教授。从事计算机视觉、深度学习和机器人等领域的研究,已在包括PAMI,T-IP,IJCV,CVPR,ICCV,ECCV,AAAI等重要国际会议和期刊上发表学术论文150余篇,多次在ChaLearn,LSun,ActivityNet,EmotionW等国际评测中取得第一,获ImageNet2016场景分类任务第二名。主持科技部重点研发计划课题,国家自然科学基金联合基金重点项目、中国科学院国际合作重点,粤港合作等项目。曾获中国科学院卢嘉锡青年人才奖。担任IEEEICIST2014国际会议程序委员会主席。
报告题目:复杂行为视频的深度识别方法与应用:从浅层特征和深度模型
摘要:基于视频的行为分析和理解是计算机视觉的一个基本问题,在监控、人机交互、视频检索、网路媒体等领域有重要的应用。与图像相比,行为视频包含有丰富的运动信息数据维度也更高。同时由于视频中包含行为人、视角、背景、运动、遮挡等复杂的变化,非受控条件下的复杂行为识别和理解一直是一个极具挑战的问题。在这个报告中,我们将介绍面向复杂行为的经典方法和最新进展,特别是我们课题组近年来开展的一些工作(CVPR13,ICCV13,CVPR14,ECCV14,CVPR15,IJCV15,CVPR16,ECCV16,ICCV17,CVPR18,PAMI18等)。内容包括视频特征编码、中层表示、轨迹卷积特征池化、运动向量CNN、时序分割模型、时空注意模型等。我们的方法在公开多类别数据库UCF101,HMDB51上取得了领先的识别率,在ActivityNet16,ChaLearn等国际竞赛中取得第一。
清华大学副教授、青千,国家优青
鲁继文
讲者简介:鲁继文,清华大学自动化系副教授、博士生导师,中组部青年千人计划入选者,国家优秀青年基金获得者。主要研究方向为计算机视觉、模式识别和机器学习,发表IEEE Transactions系列论文60余篇(其中PAMI论文11篇),ICCV、CVPR、ECCV和NIPS论文40余篇,谷歌学术引用6000余次,谷歌H指数为40,获IEEE国际会议最佳论文奖2次。主持国家重点研发计划课题1项、国家自然科学基金项目2项。担任IEEE Transactions on Circuits and Systems for Video Technology、IEEE Transactions on Biometrics, Behavior, and Identity Science、Pattern Recognition等7个国际期刊编委,中国工程院院刊Engineering青年通讯专家,ICIP、ICPR、ICME、WACV等20多个国际会议领域主席,IEEE信号处理学会多媒体信号处理技术委员会委员,IEEE信号处理学会信息取证与安全技术委员会委员,IEEE电路与系统学会多媒体系统与应用技术委员会委员。
报告题目:深度度量学习与视觉内容理解
摘要:深度度量学习通过将深度学习的特征表示能力与度量学习的相似性刻画能力相结合,以端对端的方式实现从原始输入到输出的感知,在多个视觉内容理解任务中取得了重要进展。报告首先简述深度度量学习的基本思想和研究进展,然后介绍清华大学自动化系智能视觉实验室近年来所提出的面向视觉内容理解的多个深度度量学习方法,主要包括深度判别度量学习、深度迁移度量学习、深度对抗度量学习、深度耦合度量学习、深度局部度量学习、深度多视度量学习和深度哈希度量学习等,以及它们在人脸和属性识别、物体跟踪与识别、跨模态匹配与识别、图像和视频检索等多个视觉内容理解任务中的应用。
中国科学院自动化研究所研究员
赫 然
讲者简介:赫然博士,中国科学院自动化研究所模式识别国家重点实验室研究员,中国科学院脑科学与智能技术卓越创新中心年轻骨干,中国科学院大学岗位教授。2001、2004年于大连理工大学获计算机科学学士和硕士;2009年于中国科学院自动化研究所,获模式识别与智能系统工学博士。2010年至今,在模式识别国家重点实验室任助理研究员、副研究员、项目研究员、研究员;担任中国科学院大学人工智能技术学院模式识别教研室副主任,中国图象图形学学会视觉大数据专委会秘书长。从事模式识别应用基础理论研究,获得中国科学院卢嘉锡青年人才奖、北京青年优秀科技论文一等奖、吴文俊人工智能科学技术创新奖等,并应用到生物特征识别和智能视频监控,在面智慧城市监管需求的系统平台上取得成功应用,取得一定经济效益。近期主要聚焦在生成式深度学习以及大规模图像生成中遇到的瓶颈问题,展开图像模式分析基础理论研究。出版信息理论学习专著1部;在IEEETPAMI、TIP、TIFS、TNNLS、TKDE、TBD、TSMCS等权威国际期刊以及NIPS、ICCV、CVPR、IJCAI、AAAI、SIGIR、ACMMM等权威国际会议发表论文130篇,研究工作获得国家自然科学基金优秀青年科学基金资助。
报告题目:生成对抗网络及其应用研究
摘要:生成对抗网络(GAN, Generative Adversarial Networks)是深度学习的主要组成部分,是机器学习和计算机视觉等领域的重要研究内容之一。它起源于图像数据的生成,进而被广泛应用于人工智能的各个领域。人脸图像生成是对抗生成网络的主要应用之一,通过对图像的内容进行重组,进而创造出从内容或表观上完全不同的图像。通过生成新的图像,不但可以提高原有图像的质量,同时还可以为识别分析算法提供大量的训练数据。本课程将在对抗生成网络理论和方法介绍的基础上,结合实际商业应用,介绍我们近期开展的人脸图像生成方法和应用,具体报告内容包括全光函数、生成对抗网络、身份保持损失和人脸图像旋转、人脸超分、表情生成等。
学术主任
王 亮
王亮,博士,中科院自动化所研究员,博导,IEEE高级会员、国际模式识别协会会士(IAPR Fellow),模式识别国家重点实验室副主任、图象图形学学会视觉大数据专委会主任、计算机学会计算机视觉专委会秘书长、图像视频大数据产业技术创新战略联盟秘书长、电子学会青年科学家俱乐部副主席。中科院百人计划入选者(终期优秀),国家杰出青年科学基金获得者,国家青年科技奖获得者,中科院脑科学与智能技术卓越创新中心骨干人才,国家重点研发计划项目首席。2004年获中科院自动化所工学博士学位。2004-2010年分别在英国帝国理工学院、澳大利亚莫纳什大学、墨尔本大学及英国巴斯大学工作。主要研究领域是模式识别、计算机视觉、大数据分析等。
郑伟诗
郑伟诗,中山大学数据科学与计算机学院教授。他主要面向大规模智能视频监控,展开视频图像信息与信号的处理研究,并开展大规模机器学习的算法和理论研究。他目前的主要研究应用领域是:视频监控下的行人身份识别与行为信息理解。他已发表100余篇主要学术论文,其中70余篇发表在图像识别和模式分类领域IEEETPAMI、IEEETIP、IEEETNNLS等国际主流权威期刊和ICCV、CVPR等计算机学会推荐A类国际学术会议。担任Pattern Recognition等期刊的编委,担任AVSS2012、ICPR2018、BMVC2018AreaChair等。获国家优秀青年科学基金、英国皇家学会牛顿高级学者基金等项目支持。
报名须知:
1、报名费:CCF会员2500元,非会员3000元。开班现场报名,需缴纳报名费4000元(仅支持公务卡,银行卡,不收取现金)。食宿交通自理。根据交费先后顺序,会员优先的原则录取,额满为止。
给予西部五所高校两个名额,可免费,限CCF会员,需个人提出书面申请并加盖院系公章,将电子版发至adl@ccf.org.cn, CCF将按照申请顺序进行录取。(五所高校的名单如下:新疆大学,青海大学,云南大学,贵州大学,宁夏大学。)
2、报名截止及缴费说明:
(1)报名截止日期:2018年10月29日。报名请预留不会拦截外部邮件的邮箱。
(2)CCF会员报名,请务必在报名表中填写在有效期内的CCF会员号。否则按非会员处理;
3、联系:李红梅
邮箱:adl@ccf.org.cn电话:18810669757
中国计算机学会
长按识别二维码关注我们
点击“阅读原文”,报名参加ADL93。