【预告】『机器学习与图文识别前沿技术』讲习班火热报名中

人工智能无疑是近年来最受关注的IT热点领域,作为人工智能的核心关键理论技术支撑,以深度学习为代表的机器学习理论与技术正在成为新一代人工智能及信息领域的关键基础技术。由人工智能的飞速发展而带来的科技革命,正在催生出多个领域的变革和跨越式发展,将会给我们的生活工作带来深远的影响。图像和文字是我们感知世界、理解世界、以及进行信息交流最重要的媒介之一,相关的计算机视觉、图像视频理解、文档图像分析与识别等也是目前人工智能领域中最活跃、最有潜力及最有前景的几个热点研究方向。

第10期CSIG图像图形学科前沿讲习班(Advanced Lectures on Image and Graphics,简称IGAL)于2019年4月27日-28日在北京举办,本期讲习班的主题为“机器学习与图文识别前沿技术”,由华南理工大学金连文教授担任学术主任。邀请多名国内机器学习、文字识别、计算机视觉领域的知名专家作特邀报告,介绍包括复杂版面文档图像分析与理解、机器学习公理化的研究现状与未来发展趋势、面向物理世界的强化学习理论与技术及落地应用、基于通量表示的骨架检测新方法、弱监督视觉理解及弱监督学习模型、人工智能驱动的视觉计算(视觉结构学习、视觉语义分析和理解等)、图神经网络及图匹配技术、自然场景中任意形状文字的检测和识别等一系列有特色的前沿技术。使学员了解机器学习、图文识别、计算机视觉等领域的前沿理论方法和最新进展,提高学术水平的同时,增强与机器学习和图文识别领域顶尖学者之间的学术交流。


组织机构

主办单位:中国图象图形学学会(CSIG)

承办单位:CSIG文档图像分析与识别专委会、中国科学院自动化研究所

支持单位:马上科普教育科技有限公司


时间地点

2019年4月27日-28日

北京市海淀区中关村东路95号智能化大厦三层学术报告厅


特邀讲者

刘成林

中国科学院自动化研究所 研究员

模式识别国家重点实验室主任

国家杰青,IEEE Fellow,IAPR Fellow


报告题目:文档图像版面分析技术 

摘要:版面分析是文档图像分析与识别的关键一步。版面分析标记分割出图像中所有的文本区域(段落、文本行、公式等)和非文本区域,便于后续的文本识别和文档内容理解。版面分析方法可分为自上而下的方法和自下而上的方法两大类。自上而下的方法只适合版面简单和规则的文档,而自下而上的方法可用于版面复杂和不规则的文档。近年来,版面分析研究的重点更多地聚焦在复杂版面的手写文档和手写-印刷混合文档,方法主要集中在自下而上的方法,包括基于深度神经网络的方法。本讲座将简要介绍文档版面分析的研究历史,技术概况,然后重点介绍近十年来针对复杂文档的一些主要方法:基于聚类的方法、基于弹性轮廓的方法、基于连通部件分类的方法、基于全卷积神经网络(FCN)的方法等。最后讨论当前遗留的技术问题及未来发展趋势。

简介:刘成林,中国科学院自动化研究所副所长,模式识别国家重点实验室主任,研究员、博士生导师,中国科学院大学人工智能学院副院长。2005年入选中国科学院“百人计划”。2008年获得国家杰出青年科学基金资助。1989年毕业于武汉大学无线电信息工程系,1992年在北京工业大学获电路与系统专业工学硕士学位,1995年在中国科学院自动化研究所获模式识别与智能控制专业工学博士学位。1996年3月到1997年10月在韩国科学技术院(KAIST)从事博士后研究。1997年11月到1999年3月在日本东京农工大学从事博士后研究。1999年3月到2004年12月在日立中央研究所(东京)先后任研究员和主任研究员。研究兴趣包括图像处理、模式识别、机器学习、文字识别与文档分析等。在国际期刊和国际会议上发表论文200余篇,合著英文专著一本。现任国际刊物Pattern Recognition的副主编, Image and Vision Computing, Int. J. Document Analysis and Recognition, Cognitive Computation的编委,国内期刊《自动化学报》的副主编。中国人工智能学会会士、模式识别专委会主任,中国自动化学会理事、模式识别与机器智能专委会主任,中国图象图形学学会常务理事,美国电气电子工程师协会会士 (IEEE Fellow)、国际模式识别学会会士(IAPR Fellow)。


于剑

北京交通大学计算机学院 教授

北京交通大学人工智能研究院 常务副院长

中国计算机学会会士、理事


报告题目:机器学习公理化研究的现状和未来

摘要:机器学习成为一个独立的研究方向已经接近40年,新的机器学习任务和算法不断涌现,居于新一代人工智能的核心。2015年,Jordan 与Mitchell  在Science上联合撰文指出,机器学习的一个核心问题是: 是否存在统管一切人、生物、机器的学习规律? 这个问题更加提炼锐化,即: 机器学习是否存在公共的假设,如果存在,是什么? 如果不存在,为什么? 更简单的说法是,机器学习是否可以公理化? 本报告将着重讨论这个问题,对于机器学习公理化的研究现状与未来进行分析与讨论。

简介:于剑,男,北京大学本科、硕士、博士,现任北京交通大学计算机学院教授,博士生导师,北京交通大学人工智能研究院常务副院长,交通数据分析与挖掘北京市重点实验室主任,中国计算机学会会士、理事,中国计算机学会人工智能与模式识别专业委员会秘书长,中国人工智能学会理事,中国人工智能学会机器学习专业委员会副主任,数字出版技术国家重点实验室学术委员,《Chinese Journal of Electronics》、《计算机学报》、《软件学报》、《计算机研究与发展》、《模式识别与人工智能》等编委,主持多项国家自然科学基金项目, 包括国家自然基金重点项目。主要研究兴趣是机器学习和自然语言处理,著有学术专著《机器学习:从公理到算法》。


白翔

华中科技大学电信学院 教授、副院长

国家优青


报告题目:基于通量表示的骨架检测与文字检测方法

摘要:骨架作为一种基于结构的物体描述,反映了物体的局部对称性以及各部分间的连通性,为可形变的物体提供了一种准确而有效的表示;文字作为人类发明的交流符号,也是一种特殊形状的物体,在信息传递中起着重要的作用。因此,对于骨架和文字的研究都有着重要的意义。本次报告将首先从目前骨架检测方法中存在的部分问题出发,介绍一种新的基于通量表示的骨架检测方法,之后我们将展示这种通量表示也可以可在多方向和曲形文本检测起到关键作用,可以克服目前文字检测方法中存在的部分问题,给不规则文字的检测提供了一种新的思路。

简介:白翔,华中科技大学电信学院教授、副院长,国家万人计划“青年拔尖人才”入选者,主要研究方向计算机视觉与模式识别、文档分析等。已在计算机视觉与模式识别领域一流国际期刊和会议如PAMI、CVPR等发表论文50余篇。担任期刊Pattern Recognition, Pattern Recognition Letters, Frontier of Computer Science, 自动化学报编委。曾担任CVPR、AAAI等主流国际会议的领域主席/资深技术程序委员或竞赛主席,应邀给ICDAR 2017做大会主题报告。曾获得 AAAI-2019 Outstanding SPC Award,入选2014-2018年Elsevier中国高被引学者。


李玺

浙江大学 教授


报告题目:视觉结构学习理论和应用

摘要:互联网和物联网时代催生了海量视频大数据,从这些海量视频数据中有效提取知识迫切需要各种人工智能的技术和手段。因此,如何进行人工智能驱动的视觉计算已经成为当今知识经济时代亟待解决的核心技术问题。本报告主要围绕数据驱动的人工智能学习方法,进行大规模图像/视频数据的视觉结构学习,从目标视觉感知特性、视觉特征表达、深度学习器构建机制、高层语义理解等多维度视角进行了深入剖析,并引入了大规模视觉结构学习所涉及的主要研究问题和技术方法。然后系统地回顾了视觉结构表达和学习领域的不同发展阶段,介绍了近年来我们利用视觉结构学习进行视觉语义分析和理解所做的一系列代表性的研究工作及其实际应用。

简介:李玺:教授,博导,浙江大学计算机学院人工智能研究所,浙江大学-每日互动数据智能研发中心主任,国家千人计划青年项目入选者,中国图象图形学学会理事,浙江省杰出青年科学基金获得者,浙江省特聘专家,浙江省151人才培养工程第二层次。主要从事计算机视觉、模式识别和机器学习等领域的研究和开发。在国际权威期刊和国际顶级学术会议发表文章近130篇,包括TPAMI、IJCV、TIP、TNNLS、TKDE、TMM、、TCSVT、TCYB、ICML、ICCV、CVPR、IJCAI、AAAI等。这些研究成果受到了国际学术界和工业界的热烈关注,拥有2篇ESI高被引论文,Google Scholar引用3500次左右,担任国际计算机视觉领域顶级会议ICCV 2019的领域主席(Area Chair), 担任人工智能领域顶级会议IJCAI 2019的领域主席(SPC),担任神经网络和学习系统领域顶级期刊《IEEE Transactions on Neural Networks and Learning Systems》的Associate Editor(2019.1—), 担任图像视频处理领域顶级期刊《IEEE Transactions on Circuits and Systems for Video Technology》的Associate Editor(2019.1—),担任神经计算领域知名国际刊物《Neurocomputing》和《Neural Processing Letters》的Associate Editor等学术服务兼职。获得两项最佳国际会议论文奖(包括ACCV 2010和DICTA 2012),一项最佳学生论文奖(ACML 2017),以及一项ICIP 2015 Top 10%论文奖。另外分别获得两项中国北京市自然科学技术奖(包括一等奖和二等奖),以及一项中国专利优秀奖。


程明明

南开大学 教授


报告题目:面向开放环境的自适应视觉感知

摘要:现有视觉学习技术通常依赖于大规模精确标注的训练数据。在典型实验室环境下设计和训练的人工智能模型,在行业应用场景变换时,容易导致系统性能急剧下降。本报告将从弱监督视觉理解的角度,介绍在降低模型对特定应用场景数据依赖方面所开展的一些研究工作,主要包括如何学习一些通用属性,并利用这些通用属性构建弱监督学习模型。

简介:程明明,1985年生。2012年博士毕业于清华大学,之后在英国牛津从事计算机视觉研究,并于2014年回国任教,2016年起任南开大学教授,国家“万人计划”青年拔尖人才,首批天津市杰出青年基金获得者。其主要研究方向包括:计算机图形学、计算机视觉、图像处理等。已在IEEE PAMI, ACM TOG等CCF-A类国际会议及期刊发表论文30余篇。相关研究成果论文他引10,000余次,最高单篇他引2,000余次。其研究成果在华为、腾讯等公司的旗舰产品中得以应用。其中,显著性物体检测技术被华为Mate 10等旗舰手机作为亮点特性,于产品发布会中展示。其研究工作曾被英国《BBC》、德国《明镜周刊》、美国《赫芬顿邮报》等权威国际媒体撰文报道。


俞扬

南京大学 教授


报告题目:面向物理世界的强化学习

摘要:强化学习旨在从环境交互中自主学习最优决策,近期在围棋、视频游戏对弈中有夺目表现,可取得超越人类的决策能力,但同时强化学习的一些局限,使其在工业应用中难以实施。讲习报告将从基本概念和基本方法开始介绍强化学习,并将介绍近期在强化学习落地应用方面的一些研究进展。

简介:俞扬,博士,南京大学教授。主要研究领域为人工智能、机器学习。分别于2004年和2011年获得南京大学计算机科学与技术系学士学位和博士学位,获2013年全国优秀博士学位论文奖、2011年CCF优秀博士学位论文奖。2011年8月加入南京大学计算机科学与技术系、机器学习与数据挖掘研究所(LAMDA)从事教学与科研工作。在人工智能领域国际顶级会议与期刊发表论文多篇,获得4项国际论文奖、2项国际算法竞赛冠军,入选2018年IEEE国际“人工智能十大新星”,获2018亚太数据挖掘“青年成就奖”,受邀在2018国际人工智能联合大会作“青年亮点报告”。


严骏驰

上海交通大学 研究员


报告题目:图匹配及其嵌入技术初探

摘要:图(graph)数据结构在计算机科学的诸多领域拥有广泛的应用场景,而图嵌入(graph embedding)与图匹配(graph matching)技术是分析、处理图结构的两种重要手段。图嵌入技术将高阶的图结构信息映射为向量表示,使计算更加高效;图匹配技术则借助一阶与高阶信息,寻找两个图之间节点的对应关系。在本报告中,我们首先对现有图匹配相关技术进行介绍与回顾,并进一步介绍我们基于图嵌入和深度学习的相关工作,并聚焦于图嵌入与图匹配技术在计算机视觉领域的应用。基于卷积神经网络(CNN)与图神经网络(GNN),我们实现了一个端到端的深度图匹配模型。我们的模型包含了一个排列损失函数,以及节点特征提取、图特征嵌入、相似度映射等模块。这些模块都包含了可学习的参数,能够在现有的深度学习框架下通过梯度传播端到端地学习。其中,GNN能够学习图相似度信息,进而将该信息用于匹配问题的求解。由于图匹配问题具有NP-难性质,相比于传统的、基于松弛优化的、不可学习的图匹配算法,我们的深度图匹配算法更准确、更高效,同时支持端到端的学习。

简介:严骏驰博士现任上海交通大学计算机科学与工程系特别研究员(博导),上海交通大学信息与通信工程专业博士(CCF优博,ACM中国优博提名),复旦大学大数据学院研究生校外导师。曾于IBM研究院(北京、纽约、上海)任职7年,加入上海交大之前,任IBM中国研究院主管研究员(工业视觉首席科学家),并主导了多项工业视觉检测、预防性维护技术在国内外大型企业和政府创新应用的研发与落地。近年来的研究工作致力于结构与时序信息的建模与学习,发表模式识别、机器学习领域CCF A类论文40余篇。授权美国发明专利20余项(连续两届被授予IBM全球发明大师)。现任中国图象图形学学会视觉大数据专委会副秘书长、ACM中国SIGMM执委、IEEE ACCESS期刊编委、IEEE TNNLS、PRLetters责任客座编辑。


姚聪

旷视科技有限公司 研究员


报告题目:任意形状文字的检测与识别研究

摘要:近年来,针对自然场景中任意形状文字的检测和识别技术逐渐成为学术界和工业界的研究和应用热点。本报告将介绍这一领域的基本思路和最新进展。主要内容包括:介绍自然场景文字检测和识别技术背景和问题定义;任意形状文字的检测和识别的基本思路和代表性工作;探讨待解决的问题以及下一步的研究方向。

简介:姚聪于华中科技大学电信学院获得学士和博士学位,其主要研究方向为自然场景文字检测和识别。在国际重要期刊IEEE TPAMI, IEEE TIP以及顶级会议CVPR、ICCV和ECCV等上发表论文十余篇。目前在旷视科技(Face++)担任云服务业务算法负责人,主持自然场景OCR、人脸活体检测等技术的研发工作,为FaceID互联网身份验证服务、Face++开放平台等提供算法支持。


学术主任

金连文

华南理工大学 教授

中国图象图形学学会 常务理事


金连文,华南理工大学二级教授,博士生导师,主要研究领域为深度学习、文字识别、计算机视觉、图像处理、人工智能系统等。在IEEE TPAMI、IEEE TNNLS、IEEE TIFS、IEEE TCYB、IEEE TMM、IEEE TII、IEEE TCSVT、IEEE TITS、Pattern Recognition、 Information Science、Pattern Recognition Letter、Neurocomputing等SCI国际期刊上发表学术论文50余篇(其中ESI高引论文4篇),ICDAR、ICPR、ICFHR、ICIP、ICASSP、ICME、CVPR、IJCAI、AAAI等主流国际会议论文100余篇,Google Scholar H-index 34, i10-index 89。获发明专利授权50余项,先后主持国家及省部级以上项目20余项,作为第一完成人或排名前五的主要成员荣获省部级科技奖励5次,荣获国际学术竞赛第一名4次。


日程安排

4月27日上午

08:00–08:50

入场签到

08:50–09:00

金连文

开班致辞

09:00–10:30

刘成林

文档图像版面分析技术

10:40–12:10

白   翔

基于通量表示的骨架检测与文字检测方法

4月27日下午

13:30–15:00

姚   聪

任意形状文字的检测与识别研究

15:10–16:40

严骏驰

图匹配及其嵌入技术初探

4月28日上午

09:00–10:30

于   剑

机器学习公理化研究的现状和未来

10:40–12:10

俞   扬

面向物理世界的强化学习

4月28日下午

13:30–15:00

李   玺

视觉结构学习理论和应用

15:10–16:40

程明明

面向开放环境的自适应视觉感知

16:40–17:00

结营仪式



报名及注册费

1、本期讲习班限报200人,根据缴费先后顺序录取,报满为止。

2、2019年4月21日(含)前注册并缴费:CSIG会员1600元/人,非会员报名同时加入CSIG 2000元/人(含1年会员费);4月22日以后及现场注册:会员、非会员均为3000元/人;CSIG团体会员参加,按CSIG会员标准缴费;同一单位组团(5人及以上)报名,均按CSIG会员标准缴费。

3、注册费包括讲课资料和2天会议期间午餐,其它食宿、交通自理。


报名方式

请扫描二维码网上报名


联系方式

联系人:骆老师 王老师

联系电话:010-82544676 18510866934

微信号:18510866934

邮箱:igal@csig.org.cn


-长按注册会员-

-立享会员优惠-



点击阅读原文查看更多

展开全文
Top
微信扫码咨询专知VIP会员