主办方合合信息嘉宾
CSIG企业行-走进上海合合信息将于2021年12月4日在上海举办,此次活动旨在针对文档图像分析与识别的前沿研究领域为学者们、从业者们提供交流与研讨的机会,促进产学研交流与合作。本次会议邀请到在图像描述与视觉问答、图文公式识别、自然语言处理的自注意力模型、视觉创造的机器学习等方面的优秀学者前来分享交流,会议全程在线直播,欢迎届时免费观看。
主办单位:中国图象图形学学会
承办单位:上海合合信息科技股份有限公司
CSIG文档图象分析与识别专业委员会
中国图象图形学报
协办单位:上海市图像图形学学会
主办方合合信息嘉宾
镇立新
执行主席
郭丰俊
丁凯
特邀嘉宾
纪荣嵘
报告题目:《复杂跨媒体数据协同分析与应用》
报告简介:社交媒体包含了海量非合作、异构化、跨模态的数据,既蕴藏了大量的人类知识与高价值信息,也包含了各种自然与人为的噪声,对其分析与处理需要融合类脑计算、计算机视觉、自然语言处理等多个维度的智能技术。本报告主要关注基于深度学习的多模态内容协同分析与表示、跨模态信息融合及智能对抗攻防,介绍课题组在图像描述与视觉问答、语言指导的目标检测与分割、用户隐私保护、社交网络分析引导等方面的一些研究进展。
报告人简介:纪荣嵘,厦门大学南强特聘教授,国家杰出青年科学基金获得者。主要研究方向为计算机视觉。近年来发表TPAMI、IJCV、ACM汇刊、IEEE汇刊、CVPR、NeurIPS等会议长⽂过百篇。论文谷歌学术引用万余次。曾获2016年教育部技术发明一等奖、2018年省科技进步一等奖、2019年福建省青年科技奖。曾/现主持国防973项目,国家自然科学基金联合重点基金等项目。任中国计算机学会A类国际会议CVPR和ACM Multimedia领域主席、中国图象图形学学会学术工委副主任、教育部电子信息类教指委人工智能专业建设咨询委员会委员。
邱锡鹏
报告题目:《自然语言处理中的自注意力模型》
杜俊
报告题目:《面向图文公式识别的结构化建模研究》
报告简介:近年来,随着OCR技术应用的不断深入,面向公式、汉字和图表的复杂结构建模逐渐成为研究热点之一。本报告首先介绍团队在基于编解码模型框架的公式识别方面的最新进展,包括提出一种新型的树形解码器以及基于树形解码器的互学习方法;其次,我们将树形解码器应用于基于偏旁部首建模的汉字识别及书写评价中;最后,跟大家分享一些基于编解码模型的表格结构识别研究进展。
报告人简介:杜俊是中国科学技术大学语音及语言信息处理国家工程实验室副教授,2009年-2013年就职于科大讯飞研究院和微软亚洲研究院,期间主导开发了语音识别、手写识别和OCR多个产品。研究方向是语音信号处理和模式识别应用,已发表论文200余篇,谷歌学术引用5000余次,ESI高被引论文2篇,以唯一通讯作者发表的IEEE-ACM TASLP期刊论文获得2018年IEEE信号处理学会最佳论文奖,2019年获安徽省科技进步一等奖。目前是IEEE高级会员,并担任语音领域顶级期刊IEEE-ACM TASLP的编委、IEEE信号处理学会语音及语言处理技术委员会(SLTC)委员、亚太信号与信息处理协会(APSIPA)语音语言音频分会(SLA)技术委员会的秘书长以及APSIPA Distinguished Lecturer。带领团队参加语音和图文领域国际评测获得20多项冠军。
金连文
报告题目:《文档智能理解及视觉信息抽取》
报告简介:光学字符识别(OCR)技术在图像理解、信息提取、办公文字处理、智慧教育、金融文档信息处理等诸多领域有着非常广泛的应用。近年来,OCR领域中的文字检测和识别方向已经有很多深入的研究工作和研究成果,但对文档结构化理解的研究报道还不太多。在本次报告中,我将简要回顾视觉富文档信息抽取(VIE)近年来的进展情况,介绍VIE和文档结构理解领域的一些新方法,包括OCR+VIE端到端新方法、弱监督VIE以及实体相关性匹配VIE方法等,并讨论 VIE 和 OCR 领域值得关注的一些新问题和新方向。
会议流程
参会方式