【预告】CSIG企业行走进合合信息将于12月4日召开

2021 年 11 月 19 日 中国图象图形学学会CSIG

主办方合合信息嘉宾

CSIG企业行-走进上海合合信息将于2021年12月4日在上海举办，此次活动旨在针对文档图像分析与识别的前沿研究领域为学者们、从业者们提供交流与研讨的机会，促进产学研交流与合作。本次会议邀请到在图像描述与视觉问答、图文公式识别、自然语言处理的自注意力模型、视觉创造的机器学习等方面的优秀学者前来分享交流，会议全程在线直播，欢迎届时免费观看。

主办单位：中国图象图形学学会

承办单位：上海合合信息科技股份有限公司

CSIG文档图象分析与识别专业委员会

中国图象图形学报

协办单位：上海市图像图形学学会

活动时间： 2021年12月4日 09:00-12:00

主办方合合信息嘉宾

镇立新

个人简介： 镇立新，毕业于中国科学院自动化研究所，模式识别与智能系统博士。1995 年 4 月至 1997年 8 月任大连海事大学讲师；2000 年 7 月至 2009 年 9 月任摩托罗拉（中国）电子有限公司高级经理；2008 年 11 月至 2011 年 11 月任同济大学兼职教授；2009 年 11 月至今，就职于合合信息。现任公司董事长、总经理及法定代表人。

执行主席

郭丰俊

个人简介： 郭丰俊，2000 年毕业于上海交通大学，模式识别与智能系统博士。 CSIG文档图像分析与识别专委会常务委员，2000 年 7 月至 2011 年 10 月就职于摩托罗拉（中国）电子有限公司中国研究中心。 2011年 11 月任职于合合信息，现任合合信息图像算法研发总监。

丁凯

个人简介： 丁凯，2011年获华南理工大学通信与信息系统博士学位，CSIG文档图像分析与识别专委会委员，2011 年 7 月任职于合合信息，现任合合信息自然语言算法研发总监。

特邀嘉宾

纪荣嵘

报告题目：《复杂跨媒体数据协同分析与应用》

报告简介：社交媒体包含了海量非合作、异构化、跨模态的数据，既蕴藏了大量的人类知识与高价值信息，也包含了各种自然与人为的噪声，对其分析与处理需要融合类脑计算、计算机视觉、自然语言处理等多个维度的智能技术。本报告主要关注基于深度学习的多模态内容协同分析与表示、跨模态信息融合及智能对抗攻防，介绍课题组在图像描述与视觉问答、语言指导的目标检测与分割、用户隐私保护、社交网络分析引导等方面的一些研究进展。

报告人简介：纪荣嵘，厦门大学南强特聘教授，国家杰出青年科学基金获得者。主要研究方向为计算机视觉。近年来发表TPAMI、IJCV、ACM汇刊、IEEE汇刊、CVPR、NeurIPS等会议长⽂过百篇。论文谷歌学术引用万余次。曾获2016年教育部技术发明一等奖、2018年省科技进步一等奖、2019年福建省青年科技奖。曾/现主持国防973项目，国家自然科学基金联合重点基金等项目。任中国计算机学会A类国际会议CVPR和ACM Multimedia领域主席、中国图象图形学学会学术工委副主任、教育部电子信息类教指委人工智能专业建设咨询委员会委员。

邱锡鹏

报告题目：《自然语言处理中的自注意力模型》

报告简介： 目前自注意力模型（比如Transformer）在自然语言处理领域取得了广泛的成功。本报告主要介绍我们在自注意力模型方面的一些工作，主要涵盖两部分内容： 1）Transformer及其改进模型：通过分析Transformer的基本原理和优缺点，提出一些改进模型Star-Transformer、Multi-Scale Transformer、BP-Transformer等。 2）Transformer模型的应用：将Transformer模型应用在文本分类、实体名识别等自然语言任务上，并通过针对性的改进来进一步提高性能。最后，对Transformer模型及其未来发展趋势进行展望。

报告人简介： 邱锡鹏，复旦大学计算机学院教授，国家优青获得者，于复旦大学获得理学学士和博士学位。主要从事自然语言处理、深度学习等方向的研究，发表CCF A/B类论文70余篇，获得ACL 2017杰出论文奖（CCF A类）、CCL 2019最佳论文奖，有4篇论文入选PaperDigest发布的IJCAI/ACL/EMNLP的最有影响力论文（各会议每年10篇）。出版开源专著《神经网络与深度学习》，Github关注数1.4万，豆瓣评分9.4分。主持开发了开源框架FudanNLP和FastNLP，已被国内外数百家单位使用。 2015年入选首届中国科协青年人才托举工程项目，2018年获钱伟长中文信息处理科学技术奖青年创新奖一等奖，2020-2021年连续两年入选由清华-中国工程院知识智能联合研究中心发布的"AI 2000人工智能全球最具影响力提名学者"等。培养学生曾获中国中文信息学会优博、中国人工智能学会优博、上海市优博、微软学者、百度奖学金等。

杜俊

报告题目：《面向图文公式识别的结构化建模研究》

报告简介：近年来，随着OCR技术应用的不断深入，面向公式、汉字和图表的复杂结构建模逐渐成为研究热点之一。本报告首先介绍团队在基于编解码模型框架的公式识别方面的最新进展，包括提出一种新型的树形解码器以及基于树形解码器的互学习方法；其次，我们将树形解码器应用于基于偏旁部首建模的汉字识别及书写评价中；最后，跟大家分享一些基于编解码模型的表格结构识别研究进展。

报告人简介：杜俊是中国科学技术大学语音及语言信息处理国家工程实验室副教授，2009年-2013年就职于科大讯飞研究院和微软亚洲研究院，期间主导开发了语音识别、手写识别和OCR多个产品。研究方向是语音信号处理和模式识别应用，已发表论文200余篇，谷歌学术引用5000余次，ESI高被引论文2篇，以唯一通讯作者发表的IEEE-ACM TASLP期刊论文获得2018年IEEE信号处理学会最佳论文奖，2019年获安徽省科技进步一等奖。目前是IEEE高级会员，并担任语音领域顶级期刊IEEE-ACM TASLP的编委、IEEE信号处理学会语音及语言处理技术委员会（SLTC）委员、亚太信号与信息处理协会（APSIPA）语音语言音频分会（SLA）技术委员会的秘书长以及APSIPA Distinguished Lecturer。带领团队参加语音和图文领域国际评测获得20多项冠军。

金连文

报告题目：《文档智能理解及视觉信息抽取》

报告简介：光学字符识别（OCR）技术在图像理解、信息提取、办公文字处理、智慧教育、金融文档信息处理等诸多领域有着非常广泛的应用。近年来，OCR领域中的文字检测和识别方向已经有很多深入的研究工作和研究成果，但对文档结构化理解的研究报道还不太多。在本次报告中，我将简要回顾视觉富文档信息抽取（VIE）近年来的进展情况，介绍VIE和文档结构理解领域的一些新方法，包括OCR+VIE端到端新方法、弱监督VIE以及实体相关性匹配VIE方法等，并讨论 VIE 和 OCR 领域值得关注的一些新问题和新方向。

报告人简介： 金连文，男，于中国科技大学获学士学位、华南理工大学获博士学位，目前为华南理工大学二级教授，兼任中国图像图形学学会（CSIG）常务理事、CSIG文档图像分析与识别专委会主任等学术服务职务。主要研究领域为文字识别、深度学习、计算机视觉及应用等，在IEEE Transactions及重要国际国内学术期刊、ICDAR/ICFHR/ CVPR/AAAI/IJCAI/NeurIPS/ECCV等重要国际会议上发表学术论文200余篇。获省部级科技奖5次（含排名第1的广东省科技进步一等奖1次），指导学生参加国际学术竞赛荣获冠军20余次。

会议流程