【动态】第8期文档图像学术微沙龙成功举办

2022 年 6 月 1 日 中国图象图形学学会CSIG
CSIG文档图像分析与识别专业委员会学术微沙龙(简称:文档图像微沙龙)在线学术报告会第八期于2022510日成功举行。本沙龙由中国图象图形学学会主办,文档图像分析与识别专委会发起承办,中国图象图形学报协办。本期活动邀请海康威视研究院乔梁工程师分享报告文字端到端识别技术的一些思考。微沙龙活动在B站、蔻享学术,中国图像图形学报视频号进行了同步直播,观看人数超过2000人次。
 

本次活动由海康威视研究院算法专家许昀璐主持,海康威视研究院高级算法工程师乔梁做了题为“文字端到端识别技术的一些思考”的学术报告。报告首先介绍了一些有关文字检测、识别与文字端达端识别的背景知识。接下来,以一名研发者的思路,分别介绍了两项文字端到端识别技术是在什么背景下被提出,以及如何解决实际中的问题。其中包括了为了解决弯曲文本难以识别而设计的,可以将弯曲文本边界关键点定位并矫正成为水平文本的端到端识别器Text Perceptron;以及为了去除RoI操作带来的高昂标注成本与误差累计而设计的单阶段端到端识别器MANGO。两项技术在当时都达到了SOTA的精度。第三部分中,报告嘉宾针对现在端到端识别技术发展现状,以及相关技术在实际中的落地使用情况,详细地分析了目前端到端识别技术所面临的一些挑战,以及未来该技术在学术和工业发展的思考。最后,报告嘉宾回答了听众提出的一系列问题,并号召大家共同探索解决相关难题。报告中涉及的两项工作的源代码已经开源至仓库:https://github.com/hikopensource/DAVAR-Lab-OCR,该仓库中还包含了许多团队其他工作和复现的经典方法,覆盖了大部分基础OCR和文档理解子领域。

报告的论文:

[1] Liang Qiao, Sanli Tang, Zhanzhan Cheng, Yunlu Xu, Yi Niu, Shiliang Pu, Fei Wu:
Text Perceptron: Towards End-to-End Arbitrary-Shaped Text Spotting. AAAI 2020: 11899-11907.
[2] Liang Qiao, Ying Chen, Zhanzhan Cheng, Yunlu Xu, Yi Niu, Shiliang Pu, Fei Wu:
MANGO: A Mask Attention Guided One-Stage Scene Text Spotter. AAAI 2021: 2467-2476
本次报告会获得了良好效果,我们期待更多优秀青年学子在文档图像领域取得研究进展,并在后续的沙龙报告会中踊跃参与、共同进步!
错过直播的同学可以前往B站观看回放视频,链接:
https://www.bilibili.com/video/BV1jP4y1F7Xw?share_source=copy_web





关于征集中国图象图形学学会产业科技服务团专家的通知
《Visual Intelligence》英文刊编辑招聘启事
中国图象图形学学会高校志愿者招募
中国图象图形学学会关于组织开展科技成果鉴定的通知

2022年CSIG图像图形中国行承办方征集中

登录查看更多
0

相关内容

基于预训练语言模型的文本生成
专知会员服务
28+阅读 · 2022年1月28日
专知会员服务
55+阅读 · 2021年3月5日
【北京大学冯岩松】基于知识的自然语言问答
专知会员服务
44+阅读 · 2020年11月15日
【预告】中国图象图形学学会第8期珠峰论坛将于6月6日召开
中国图象图形学学会CSIG
0+阅读 · 2022年6月2日
【动态】第四期CSIG文档图像分析与识别专业委员会学术微沙龙成功举办
国家自然科学基金
6+阅读 · 2017年6月30日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年4月20日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年6月30日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年4月30日
Arxiv
0+阅读 · 2022年7月27日
Adversarial Mutual Information for Text Generation
Arxiv
13+阅读 · 2020年6月30日
Knowledge Representation Learning: A Quantitative Review
Arxiv
19+阅读 · 2018年5月17日
VIP会员
相关VIP内容
基于预训练语言模型的文本生成
专知会员服务
28+阅读 · 2022年1月28日
专知会员服务
55+阅读 · 2021年3月5日
【北京大学冯岩松】基于知识的自然语言问答
专知会员服务
44+阅读 · 2020年11月15日
相关资讯
【预告】中国图象图形学学会第8期珠峰论坛将于6月6日召开
中国图象图形学学会CSIG
0+阅读 · 2022年6月2日
【动态】第四期CSIG文档图像分析与识别专业委员会学术微沙龙成功举办
相关基金
国家自然科学基金
6+阅读 · 2017年6月30日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年4月20日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年6月30日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年4月30日
Top
微信扫码咨询专知VIP会员