【动态】第二期CSIG文档图像分析与识别专业委员会学术微沙龙成功在线举办 - 专知

会员服务 ·

0

【动态】第二期CSIG文档图像分析与识别专业委员会学术微沙龙成功在线举办

2021 年 11 月 18 日 中国图象图形学学会CSIG

CSIG文档图像分析与识别专业委员会学术微沙龙（简称：文档图像微沙龙）在线学术报告会第二期于2021年10月12日成功举行。本沙龙由中国图象图形学学会主办，文档图像分析与识别专委会发起承办，中国图象图形学报协办。本期活动邀请华南理工大学罗灿杰博士分享报告：数据困境下的文字识别——无标签图像去噪、自适应数据增广及手写样本合成。微沙龙活动在B站、中国图像图形学报视频号进行了同步直播，人气峰值近4000。

活动由华南理工大学张鑫副教授主持。来自华南理工大学的博士研究生罗灿杰做了题为“数据困境下的文字识别”的学术报告。报告首先介绍了数据驱动的深度学习时代背景，列举了场景文字和手写文字识别的三个挑战：（1）复杂的背景噪声；（2）几何形状和书写风格多样性；（3）书写语料局限性。报告重点从三个方面介绍数据困境下的方案：1）无标签的文本行图像去噪（发表于IJCV 2021国际期刊）。该方法利用注意力机制提取每个字符，与单字符模板进行生成对抗训练，从而去除背景噪声。同时该方法根据识别结果微调字符，从而生成更利于识别的图像，进一步降低识别难度；2）文本行图像的自适应增广（发表于CVPR 2020国际会议）。该方法使用多个控制点实现更灵活的弹性变换，并在训练过程中挖掘困难样本，丰富数据的多样性，提高识别器的稳健性；3）手写体的合成。相比标准字体，手写体合成的自由度更高，难度更大。报告通过Demo演示的形式，展现手写体合成的重要性，并对数据多样性进行分析。

报告嘉宾还回答了听众的问题，包括注意力机制在长文本上的定位精度问题、中文大类别挑战的问题、训练稳定性问题等。报告嘉宾号召广大同行共同解决中文识别问题，进一步完善中文社区的相关技术。

报告的论文：

1. Separating Content from Style Using Adversarial Learning for Recognizing Text in the Wild

链接地址：https://arxiv.org/abs/2001.04189

2. Learn to Augment: Joint Data Augmentation and Network Optimization for Text Recognition

链接地址：https://arxiv.org/abs/2003.06606

本次报告会获得了良好效果，我们期待更多优秀青年学子在文档图像领域取得研究进展，并在后续的沙龙报告会中踊跃参与、共同进步！

错过直播的同学可以前往B站观看回放视频，点击阅读原文，打开直播回放链接。

来源：CSIG文档图像分析与识别专委会

关于第十一届国际图象图形学学术会议延期举办的通知

中国图象图形学学会关于组织开展科技成果鉴定的通知

CSIG图像图形中国行承办方征集中

登录查看更多

0

相关内容

图像分析

【中科院自动化所刘成林研究员】跨模态零样本文字识别

【中科院自动化所刘成林研究员】跨模态零样本文字识别

专知会员服务

36+阅读 · 2021年4月17日

【AAAI2021】面向真实世界的鲁棒视觉信息提取:新的数据集和新颖的解决方案

【AAAI2021】面向真实世界的鲁棒视觉信息提取:新的数据集和新颖的解决方案

专知会员服务

22+阅读 · 2021年2月17日

【KDD2020】通用文档预训练模型LayoutLM：文档结构信息和视觉信息进行建模，让模型在预训练阶段进行多模态对齐。

【KDD2020】通用文档预训练模型LayoutLM：文档结构信息和视觉信息进行建模，让模型在预训练阶段进行多模态对齐。

专知会员服务

32+阅读 · 2020年8月23日

最新《生成式对抗网络》简介，25页ppt

最新《生成式对抗网络》简介，25页ppt

专知会员服务

175+阅读 · 2020年6月28日

【高能所】如何做好⼀份学术报告& 简单介绍LaTeX 的使用

【高能所】如何做好⼀份学术报告& 简单介绍LaTeX 的使用

专知会员服务

94+阅读 · 2020年5月16日

【会议推荐】CV101大会：基于深度学习的⽂字识别----- 现状及展望，金连文，华南理工大学二级教授。（附PPT）

【会议推荐】CV101大会：基于深度学习的⽂字识别----- 现状及展望，金连文，华南理工大学二级教授。（附PPT）

专知会员服务

27+阅读 · 2019年11月19日

【CCL 2019】信息抽取前沿动态，中科院自动化模式识别国家重点实验室助理研究员陈玉博博士

【CCL 2019】信息抽取前沿动态，中科院自动化模式识别国家重点实验室助理研究员陈玉博博士

专知会员服务

85+阅读 · 2019年11月12日

【MLA 2019】图像的非监督增强匹配，清华大学张长水教授

【MLA 2019】图像的非监督增强匹配，清华大学张长水教授

专知会员服务

28+阅读 · 2019年11月6日

浅谈文字识别：新思考、新挑战及新机遇，华南理工大学金连文教授，VALSE2019: 让机器像人一样阅读：文字检测与识别新趋势

浅谈文字识别：新思考、新挑战及新机遇，华南理工大学金连文教授，VALSE2019: 让机器像人一样阅读：文字检测与识别新趋势

专知会员服务

26+阅读 · 2019年10月24日

2019年机器学习框架回顾

2019年机器学习框架回顾

专知会员服务

36+阅读 · 2019年10月11日

【动态】第五期CSIG文档图像分析与识别专业委员会学术微沙龙成功在线举办

【动态】第五期CSIG文档图像分析与识别专业委员会学术微沙龙成功在线举办

中国图象图形学学会CSIG

0+阅读 · 2022年3月14日

【动态】CSIG云上微表情第25期研讨会成功举办

【动态】CSIG云上微表情第25期研讨会成功举办

中国图象图形学学会CSIG

0+阅读 · 2022年3月7日

【动态】第二届CSIG图像图形技术挑战赛圆满结束

【动态】第二届CSIG图像图形技术挑战赛圆满结束

中国图象图形学学会CSIG

1+阅读 · 2022年1月4日

【动态】第十一届国际图象图形学学术会议在海口成功举办

【动态】第十一届国际图象图形学学术会议在海口成功举办

中国图象图形学学会CSIG

1+阅读 · 2021年12月29日

【动态】第四期CSIG文档图像分析与识别专业委员会学术微沙龙成功举办

【动态】第四期CSIG文档图像分析与识别专业委员会学术微沙龙成功举办

中国图象图形学学会CSIG

0+阅读 · 2021年12月17日

【动态】CSIG多媒体计算学术会议青年论坛成功召开

【动态】CSIG多媒体计算学术会议青年论坛成功召开

中国图象图形学学会CSIG

0+阅读 · 2021年12月10日

【动态】第三期CSIG文档图像分析与识别专业委员会学术微沙龙成功在线举办

【动态】第三期CSIG文档图像分析与识别专业委员会学术微沙龙成功在线举办

中国图象图形学学会CSIG

0+阅读 · 2021年11月18日

【动态】CSIG可微分视觉信息采集国际研讨会于10月23日在线上成功召开

【动态】CSIG可微分视觉信息采集国际研讨会于10月23日在线上成功召开

中国图象图形学学会CSIG

0+阅读 · 2021年10月27日

【动态】第一期中国图象图形学学会文档图像学术微沙龙成功在线举办

【动态】第一期中国图象图形学学会文档图像学术微沙龙成功在线举办

中国图象图形学学会CSIG

0+阅读 · 2021年9月6日

【动态】CSIG图像图形中国行在大连理工大学成功举办

【动态】CSIG图像图形中国行在大连理工大学成功举办

中国图象图形学学会CSIG

0+阅读 · 2021年8月6日

行人重识别目标中心编码外观模型的研究

国家自然科学基金

1+阅读 · 2015年12月31日

中国数学会2015学术年会暨中国数学会成立八十周年纪念会

国家自然科学基金

0+阅读 · 2015年4月20日

梁板结构的分布动载荷识别技术

国家自然科学基金

0+阅读 · 2013年12月31日

人脸图像的身份和表情同步识别方法研究

国家自然科学基金

2+阅读 · 2012年12月31日

手写中文文本识别的高扩展判别学习理论和方法

国家自然科学基金

0+阅读 · 2012年12月31日

全国计算力学自主软件学术研讨会

国家自然科学基金

0+阅读 · 2012年9月30日

2012年全国高分子材料科学与工程研讨会

国家自然科学基金

0+阅读 · 2012年4月30日

实时双模态自动图像软标注与多关键词检索

国家自然科学基金

0+阅读 · 2009年12月31日

鲁棒的目标跟踪和识别新方法及在羽绒识别中的应用研究

国家自然科学基金

1+阅读 · 2009年12月31日

基于分布Maple系统下的吴方法的并行计算

国家自然科学基金

1+阅读 · 2009年12月31日

Named Entity Recognition for Partially Annotated Datasets

Arxiv

0+阅读 · 2022年4月19日

Music Source Separation with Generative Flow

Arxiv

0+阅读 · 2022年4月19日

Dual-Domain Image Synthesis using Segmentation-Guided GAN

Arxiv

0+阅读 · 2022年4月19日

Table-based Fact Verification with Self-adaptive Mixture of Experts

Arxiv

0+阅读 · 2022年4月19日

AI for human assessment: What do professional assessors need?

Arxiv

0+阅读 · 2022年4月18日

HFT-ONLSTM: Hierarchical and Fine-Tuning Multi-label Text Classification

Arxiv

0+阅读 · 2022年4月18日

A Logical Analysis of Dynamic Dependence

Arxiv

0+阅读 · 2022年4月16日

Active Learning for Regression and Classification by Inverse Distance Weighting

Arxiv

0+阅读 · 2022年4月14日

Deformable Style Transfer

Deformable Style Transfer

Arxiv

14+阅读 · 2020年3月24日

Unsupervised Cipher Cracking Using Discrete GANs

Arxiv

11+阅读 · 2018年1月15日

VIP会员

相关主题

相关VIP内容

【中科院自动化所刘成林研究员】跨模态零样本文字识别

【中科院自动化所刘成林研究员】跨模态零样本文字识别

专知会员服务

36+阅读 · 2021年4月17日

【AAAI2021】面向真实世界的鲁棒视觉信息提取:新的数据集和新颖的解决方案

【AAAI2021】面向真实世界的鲁棒视觉信息提取:新的数据集和新颖的解决方案

专知会员服务

22+阅读 · 2021年2月17日

【KDD2020】通用文档预训练模型LayoutLM：文档结构信息和视觉信息进行建模，让模型在预训练阶段进行多模态对齐。

【KDD2020】通用文档预训练模型LayoutLM：文档结构信息和视觉信息进行建模，让模型在预训练阶段进行多模态对齐。

专知会员服务

32+阅读 · 2020年8月23日

最新《生成式对抗网络》简介，25页ppt

最新《生成式对抗网络》简介，25页ppt

专知会员服务

175+阅读 · 2020年6月28日

【高能所】如何做好⼀份学术报告& 简单介绍LaTeX 的使用

【高能所】如何做好⼀份学术报告& 简单介绍LaTeX 的使用

专知会员服务

94+阅读 · 2020年5月16日

【会议推荐】CV101大会：基于深度学习的⽂字识别----- 现状及展望，金连文，华南理工大学二级教授。（附PPT）

【会议推荐】CV101大会：基于深度学习的⽂字识别----- 现状及展望，金连文，华南理工大学二级教授。（附PPT）

专知会员服务

27+阅读 · 2019年11月19日

【CCL 2019】信息抽取前沿动态，中科院自动化模式识别国家重点实验室助理研究员陈玉博博士

【CCL 2019】信息抽取前沿动态，中科院自动化模式识别国家重点实验室助理研究员陈玉博博士

专知会员服务

85+阅读 · 2019年11月12日

【MLA 2019】图像的非监督增强匹配，清华大学张长水教授

【MLA 2019】图像的非监督增强匹配，清华大学张长水教授

专知会员服务

28+阅读 · 2019年11月6日

浅谈文字识别：新思考、新挑战及新机遇，华南理工大学金连文教授，VALSE2019: 让机器像人一样阅读：文字检测与识别新趋势

浅谈文字识别：新思考、新挑战及新机遇，华南理工大学金连文教授，VALSE2019: 让机器像人一样阅读：文字检测与识别新趋势

专知会员服务

26+阅读 · 2019年10月24日

2019年机器学习框架回顾

2019年机器学习框架回顾

专知会员服务

36+阅读 · 2019年10月11日

热门VIP内容

开通专知VIP会员享更多权益服务

新书册《几何深度学习的数学基础》

中程单向攻击无人机的战略意义：俄乌战争启示

在无标注条件下适配视觉—语言模型：全面综述

面向视觉语言模型的持续学习：遗忘之外的综述与分类体系

相关资讯

【动态】第五期CSIG文档图像分析与识别专业委员会学术微沙龙成功在线举办

【动态】第五期CSIG文档图像分析与识别专业委员会学术微沙龙成功在线举办

中国图象图形学学会CSIG

0+阅读 · 2022年3月14日

【动态】CSIG云上微表情第25期研讨会成功举办

【动态】CSIG云上微表情第25期研讨会成功举办

中国图象图形学学会CSIG

0+阅读 · 2022年3月7日

【动态】第二届CSIG图像图形技术挑战赛圆满结束

【动态】第二届CSIG图像图形技术挑战赛圆满结束

中国图象图形学学会CSIG

1+阅读 · 2022年1月4日

【动态】第十一届国际图象图形学学术会议在海口成功举办

【动态】第十一届国际图象图形学学术会议在海口成功举办

中国图象图形学学会CSIG

1+阅读 · 2021年12月29日

【动态】第四期CSIG文档图像分析与识别专业委员会学术微沙龙成功举办

【动态】第四期CSIG文档图像分析与识别专业委员会学术微沙龙成功举办

中国图象图形学学会CSIG

0+阅读 · 2021年12月17日

【动态】CSIG多媒体计算学术会议青年论坛成功召开

【动态】CSIG多媒体计算学术会议青年论坛成功召开

中国图象图形学学会CSIG

0+阅读 · 2021年12月10日

【动态】第三期CSIG文档图像分析与识别专业委员会学术微沙龙成功在线举办

【动态】第三期CSIG文档图像分析与识别专业委员会学术微沙龙成功在线举办

中国图象图形学学会CSIG

0+阅读 · 2021年11月18日

【动态】CSIG可微分视觉信息采集国际研讨会于10月23日在线上成功召开

【动态】CSIG可微分视觉信息采集国际研讨会于10月23日在线上成功召开

中国图象图形学学会CSIG

0+阅读 · 2021年10月27日

【动态】第一期中国图象图形学学会文档图像学术微沙龙成功在线举办

【动态】第一期中国图象图形学学会文档图像学术微沙龙成功在线举办

中国图象图形学学会CSIG

0+阅读 · 2021年9月6日

【动态】CSIG图像图形中国行在大连理工大学成功举办

【动态】CSIG图像图形中国行在大连理工大学成功举办

中国图象图形学学会CSIG

0+阅读 · 2021年8月6日

相关基金

行人重识别目标中心编码外观模型的研究

国家自然科学基金

1+阅读 · 2015年12月31日

中国数学会2015学术年会暨中国数学会成立八十周年纪念会

国家自然科学基金

0+阅读 · 2015年4月20日

梁板结构的分布动载荷识别技术

国家自然科学基金

0+阅读 · 2013年12月31日

人脸图像的身份和表情同步识别方法研究

国家自然科学基金

2+阅读 · 2012年12月31日

手写中文文本识别的高扩展判别学习理论和方法

国家自然科学基金

0+阅读 · 2012年12月31日

全国计算力学自主软件学术研讨会

国家自然科学基金

0+阅读 · 2012年9月30日

2012年全国高分子材料科学与工程研讨会

国家自然科学基金

0+阅读 · 2012年4月30日

实时双模态自动图像软标注与多关键词检索

国家自然科学基金

0+阅读 · 2009年12月31日

鲁棒的目标跟踪和识别新方法及在羽绒识别中的应用研究

国家自然科学基金

1+阅读 · 2009年12月31日

基于分布Maple系统下的吴方法的并行计算

国家自然科学基金

1+阅读 · 2009年12月31日

相关论文

Named Entity Recognition for Partially Annotated Datasets

Arxiv

0+阅读 · 2022年4月19日

Music Source Separation with Generative Flow

Arxiv

0+阅读 · 2022年4月19日

Dual-Domain Image Synthesis using Segmentation-Guided GAN

Arxiv

0+阅读 · 2022年4月19日

Table-based Fact Verification with Self-adaptive Mixture of Experts

Arxiv

0+阅读 · 2022年4月19日

AI for human assessment: What do professional assessors need?

Arxiv

0+阅读 · 2022年4月18日

HFT-ONLSTM: Hierarchical and Fine-Tuning Multi-label Text Classification

Arxiv

0+阅读 · 2022年4月18日

A Logical Analysis of Dynamic Dependence

Arxiv

0+阅读 · 2022年4月16日

Active Learning for Regression and Classification by Inverse Distance Weighting

Arxiv

0+阅读 · 2022年4月14日

Deformable Style Transfer

Deformable Style Transfer

Arxiv

14+阅读 · 2020年3月24日

Unsupervised Cipher Cracking Using Discrete GANs

Arxiv

11+阅读 · 2018年1月15日

大家都在搜

久别重逢话双塔

大型语言模型

国防科技创新

软件无线电

再见，TD-SCDMA！

微信扫码咨询专知VIP会员