【动态】第8期文档图像学术微沙龙成功举办 - 专知

会员服务 ·

0

【动态】第8期文档图像学术微沙龙成功举办

2022 年 6 月 1 日 中国图象图形学学会CSIG

CSIG文档图像分析与识别专业委员会学术微沙龙（简称：文档图像微沙龙）在线学术报告会第八期于2022年5月10日成功举行。本沙龙由中国图象图形学学会主办，文档图像分析与识别专委会发起承办，中国图象图形学报协办。本期活动邀请海康威视研究院乔梁工程师分享报告: 文字端到端识别技术的一些思考。微沙龙活动在B站、蔻享学术，中国图像图形学报视频号进行了同步直播,观看人数超过2000人次。

本次活动由海康威视研究院算法专家许昀璐主持，海康威视研究院高级算法工程师乔梁做了题为“文字端到端识别技术的一些思考”的学术报告。报告首先介绍了一些有关文字检测、识别与文字端达端识别的背景知识。接下来，以一名研发者的思路，分别介绍了两项文字端到端识别技术是在什么背景下被提出，以及如何解决实际中的问题。其中包括了为了解决弯曲文本难以识别而设计的，可以将弯曲文本边界关键点定位并矫正成为水平文本的端到端识别器Text Perceptron；以及为了去除RoI操作带来的高昂标注成本与误差累计而设计的单阶段端到端识别器MANGO。两项技术在当时都达到了SOTA的精度。第三部分中，报告嘉宾针对现在端到端识别技术发展现状，以及相关技术在实际中的落地使用情况，详细地分析了目前端到端识别技术所面临的一些挑战，以及未来该技术在学术和工业发展的思考。最后，报告嘉宾回答了听众提出的一系列问题，并号召大家共同探索解决相关难题。报告中涉及的两项工作的源代码已经开源至仓库：https://github.com/hikopensource/DAVAR-Lab-OCR，该仓库中还包含了许多团队其他工作和复现的经典方法，覆盖了大部分基础OCR和文档理解子领域。

报告的论文：

[1] Liang Qiao, Sanli Tang, Zhanzhan Cheng, Yunlu Xu, Yi Niu, Shiliang Pu, Fei Wu:

Text Perceptron: Towards End-to-End Arbitrary-Shaped Text Spotting. AAAI 2020: 11899-11907.

[2] Liang Qiao, Ying Chen, Zhanzhan Cheng, Yunlu Xu, Yi Niu, Shiliang Pu, Fei Wu:

MANGO: A Mask Attention Guided One-Stage Scene Text Spotter. AAAI 2021: 2467-2476

本次报告会获得了良好效果，我们期待更多优秀青年学子在文档图像领域取得研究进展，并在后续的沙龙报告会中踊跃参与、共同进步！

错过直播的同学可以前往B站观看回放视频，链接：

https://www.bilibili.com/video/BV1jP4y1F7Xw?share_source=copy_web

关于征集中国图象图形学学会产业科技服务团专家的通知

《Visual Intelligence》英文刊编辑招聘启事

中国图象图形学学会高校志愿者招募

中国图象图形学学会关于组织开展科技成果鉴定的通知

2022年CSIG图像图形中国行承办方征集中

登录查看更多

0

相关内容

文档图像

【CVPR 2022】可转移的稀疏对抗性攻击，Transferable Sparse Adversarial Attack

【CVPR 2022】可转移的稀疏对抗性攻击，Transferable Sparse Adversarial Attack

专知会员服务

15+阅读 · 2022年3月12日

基于预训练语言模型的文本生成

基于预训练语言模型的文本生成

专知会员服务

29+阅读 · 2022年1月28日

深度人脸表情识别研究进展

专知会员服务

56+阅读 · 2021年3月5日

【北京大学冯岩松】基于知识的自然语言问答

【北京大学冯岩松】基于知识的自然语言问答

专知会员服务

45+阅读 · 2020年11月15日

《人工智能新数学问题: 广义约束》，中科院自动化所胡包钢研究员

《人工智能新数学问题: 广义约束》，中科院自动化所胡包钢研究员

专知会员服务

40+阅读 · 2020年10月27日

【会议推荐】CV101大会：基于深度学习的⽂字识别----- 现状及展望，金连文，华南理工大学二级教授。（附PPT）

【会议推荐】CV101大会：基于深度学习的⽂字识别----- 现状及展望，金连文，华南理工大学二级教授。（附PPT）

专知会员服务

27+阅读 · 2019年11月19日

浅谈文字识别：新思考、新挑战及新机遇，华南理工大学金连文教授，VALSE2019: 让机器像人一样阅读：文字检测与识别新趋势

浅谈文字识别：新思考、新挑战及新机遇，华南理工大学金连文教授，VALSE2019: 让机器像人一样阅读：文字检测与识别新趋势

专知会员服务

26+阅读 · 2019年10月24日

文档分析与识别技术回顾与反思，中国科学院自动化研究所刘成林研究员，VALSE2019: 让机器像人一样阅读：文字检测与识别新趋势

文档分析与识别技术回顾与反思，中国科学院自动化研究所刘成林研究员，VALSE2019: 让机器像人一样阅读：文字检测与识别新趋势

专知会员服务

38+阅读 · 2019年10月24日

问答与对话-技术与系统之任务型对话系统【车万翔张伟男】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第13期

问答与对话-技术与系统之任务型对话系统【车万翔张伟男】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第13期

专知会员服务

63+阅读 · 2019年10月23日

问答与对话-技术与系统之基于深度学习的机器阅读理解【崔一鸣】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第14期

问答与对话-技术与系统之基于深度学习的机器阅读理解【崔一鸣】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第14期

专知会员服务

47+阅读 · 2019年10月23日

【动态】第十期CSIG文档图像分析与识别专业委员会学术微沙龙成功举办

【动态】第十期CSIG文档图像分析与识别专业委员会学术微沙龙成功举办

中国图象图形学学会CSIG

0+阅读 · 2022年7月18日

【预告】中国图象图形学学会第8期珠峰论坛将于6月6日召开

【预告】中国图象图形学学会第8期珠峰论坛将于6月6日召开

中国图象图形学学会CSIG

0+阅读 · 2022年6月2日

【动态】第五期CSIG文档图像分析与识别专业委员会学术微沙龙成功在线举办

【动态】第五期CSIG文档图像分析与识别专业委员会学术微沙龙成功在线举办

中国图象图形学学会CSIG

0+阅读 · 2022年3月14日

【动态】第四期CSIG文档图像分析与识别专业委员会学术微沙龙成功举办

【动态】第四期CSIG文档图像分析与识别专业委员会学术微沙龙成功举办

中国图象图形学学会CSIG

0+阅读 · 2021年12月17日

【动态】第五届文档图像分析与识别前沿理论与应用研讨会暨中国图象图形学学会文档图像分析与识别专委会2021学术年会成功召开

【动态】第五届文档图像分析与识别前沿理论与应用研讨会暨中国图象图形学学会文档图像分析与识别专委会2021学术年会成功召开

中国图象图形学学会CSIG

0+阅读 · 2021年12月6日

【动态】第三期CSIG文档图像分析与识别专业委员会学术微沙龙成功在线举办

【动态】第三期CSIG文档图像分析与识别专业委员会学术微沙龙成功在线举办

中国图象图形学学会CSIG

1+阅读 · 2021年11月18日

【动态】第二期CSIG文档图像分析与识别专业委员会学术微沙龙成功在线举办

【动态】第二期CSIG文档图像分析与识别专业委员会学术微沙龙成功在线举办

中国图象图形学学会CSIG

0+阅读 · 2021年11月18日

【动态】第一期中国图象图形学学会文档图像学术微沙龙成功在线举办

【动态】第一期中国图象图形学学会文档图像学术微沙龙成功在线举办

中国图象图形学学会CSIG

0+阅读 · 2021年9月6日

CSIG云上微表情第十八期研讨会成功举办--结合深度学习的微表情检测方法

CSIG云上微表情第十八期研讨会成功举办--结合深度学习的微表情检测方法

CSIG机器视觉专委会

1+阅读 · 2021年8月3日

首届事理图谱研讨会7月20日在哈尔滨工业大学计算机学院成功举办

首届事理图谱研讨会7月20日在哈尔滨工业大学计算机学院成功举办

哈工大SCIR

13+阅读 · 2019年7月22日

非线性组合优化暑期学校暨学术前沿研讨会

国家自然科学基金

6+阅读 · 2017年6月30日

华北克拉通破坏学术交流活动（第五阶段）

国家自然科学基金

6+阅读 · 2015年12月31日

中国数学会2015学术年会暨中国数学会成立八十周年纪念会

国家自然科学基金

0+阅读 · 2015年4月20日

华北克拉通破坏学术交流活动（第四阶段）

国家自然科学基金

0+阅读 · 2014年12月31日

带界面结构的一体化仿生骨软骨支架的研制及修复骨软骨缺损的实验研究

国家自然科学基金

0+阅读 · 2013年12月31日

双向梯度软骨支架的构建及关节软骨组织工程的实验研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于内容分析和行为分析的社区问答关键技术研究

国家自然科学基金

1+阅读 · 2012年12月31日

第六届全国动力学与控制青年学者学术研讨会

国家自然科学基金

0+阅读 · 2012年6月30日

自动化学科发展动态与基金项目成果报道

国家自然科学基金

0+阅读 · 2011年12月31日

承办数学天元基金学术领导小组2011年度第一次会议

国家自然科学基金

0+阅读 · 2011年4月30日

Pronunciation-aware unique character encoding for RNN Transducer-based Mandarin speech recognition

Arxiv

0+阅读 · 2022年7月29日

Contrastive Masked Autoencoders are Stronger Vision Learners

Arxiv

0+阅读 · 2022年7月27日

GT4SD: Generative Toolkit for Scientific Discovery

Arxiv

0+阅读 · 2022年7月27日

Cascade Decoders-Based Autoencoders for Image Reconstruction

Arxiv

0+阅读 · 2022年7月27日

Adversarial and Contrastive Variational Autoencoder for Sequential Recommendation

Arxiv

17+阅读 · 2021年3月19日

Adversarial Mutual Information for Text Generation

Adversarial Mutual Information for Text Generation

Arxiv

13+阅读 · 2020年6月30日

Sequential Scenario-Specific Meta Learner for Online Recommendation

Sequential Scenario-Specific Meta Learner for Online Recommendation

Arxiv

16+阅读 · 2019年6月2日

Knowledge Representation Learning: A Quantitative Review

Knowledge Representation Learning: A Quantitative Review

Arxiv

28+阅读 · 2018年12月28日

Zero-Shot Object Detection by Hybrid Region Embedding

Arxiv

19+阅读 · 2018年5月17日

Learning over Knowledge-Base Embeddings for Recommendation

Arxiv

23+阅读 · 2018年3月22日

VIP会员

相关主题

相关VIP内容

【CVPR 2022】可转移的稀疏对抗性攻击，Transferable Sparse Adversarial Attack

【CVPR 2022】可转移的稀疏对抗性攻击，Transferable Sparse Adversarial Attack

专知会员服务

15+阅读 · 2022年3月12日

基于预训练语言模型的文本生成

基于预训练语言模型的文本生成

专知会员服务

29+阅读 · 2022年1月28日

深度人脸表情识别研究进展

专知会员服务

56+阅读 · 2021年3月5日

【北京大学冯岩松】基于知识的自然语言问答

【北京大学冯岩松】基于知识的自然语言问答

专知会员服务

45+阅读 · 2020年11月15日

《人工智能新数学问题: 广义约束》，中科院自动化所胡包钢研究员

《人工智能新数学问题: 广义约束》，中科院自动化所胡包钢研究员

专知会员服务

40+阅读 · 2020年10月27日

【会议推荐】CV101大会：基于深度学习的⽂字识别----- 现状及展望，金连文，华南理工大学二级教授。（附PPT）

【会议推荐】CV101大会：基于深度学习的⽂字识别----- 现状及展望，金连文，华南理工大学二级教授。（附PPT）

专知会员服务

27+阅读 · 2019年11月19日

浅谈文字识别：新思考、新挑战及新机遇，华南理工大学金连文教授，VALSE2019: 让机器像人一样阅读：文字检测与识别新趋势

浅谈文字识别：新思考、新挑战及新机遇，华南理工大学金连文教授，VALSE2019: 让机器像人一样阅读：文字检测与识别新趋势

专知会员服务

26+阅读 · 2019年10月24日

文档分析与识别技术回顾与反思，中国科学院自动化研究所刘成林研究员，VALSE2019: 让机器像人一样阅读：文字检测与识别新趋势

文档分析与识别技术回顾与反思，中国科学院自动化研究所刘成林研究员，VALSE2019: 让机器像人一样阅读：文字检测与识别新趋势

专知会员服务

38+阅读 · 2019年10月24日

问答与对话-技术与系统之任务型对话系统【车万翔张伟男】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第13期

问答与对话-技术与系统之任务型对话系统【车万翔张伟男】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第13期

专知会员服务

63+阅读 · 2019年10月23日

问答与对话-技术与系统之基于深度学习的机器阅读理解【崔一鸣】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第14期

问答与对话-技术与系统之基于深度学习的机器阅读理解【崔一鸣】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第14期

专知会员服务

47+阅读 · 2019年10月23日

热门VIP内容

开通专知VIP会员享更多权益服务

数据要素发展报告(2025年)：附下载

人工智能代理提升战时舰船战备水平

【NeurIPS2025教程】大语言模型规划

NeurIPS 2025 教程：深度学习训练不稳定性的理论洞见

相关资讯

【动态】第十期CSIG文档图像分析与识别专业委员会学术微沙龙成功举办

【动态】第十期CSIG文档图像分析与识别专业委员会学术微沙龙成功举办

中国图象图形学学会CSIG

0+阅读 · 2022年7月18日

【预告】中国图象图形学学会第8期珠峰论坛将于6月6日召开

【预告】中国图象图形学学会第8期珠峰论坛将于6月6日召开

中国图象图形学学会CSIG

0+阅读 · 2022年6月2日

【动态】第五期CSIG文档图像分析与识别专业委员会学术微沙龙成功在线举办

【动态】第五期CSIG文档图像分析与识别专业委员会学术微沙龙成功在线举办

中国图象图形学学会CSIG

0+阅读 · 2022年3月14日

【动态】第四期CSIG文档图像分析与识别专业委员会学术微沙龙成功举办

【动态】第四期CSIG文档图像分析与识别专业委员会学术微沙龙成功举办

中国图象图形学学会CSIG

0+阅读 · 2021年12月17日

【动态】第五届文档图像分析与识别前沿理论与应用研讨会暨中国图象图形学学会文档图像分析与识别专委会2021学术年会成功召开

【动态】第五届文档图像分析与识别前沿理论与应用研讨会暨中国图象图形学学会文档图像分析与识别专委会2021学术年会成功召开

中国图象图形学学会CSIG

0+阅读 · 2021年12月6日

【动态】第三期CSIG文档图像分析与识别专业委员会学术微沙龙成功在线举办

【动态】第三期CSIG文档图像分析与识别专业委员会学术微沙龙成功在线举办

中国图象图形学学会CSIG

1+阅读 · 2021年11月18日

【动态】第二期CSIG文档图像分析与识别专业委员会学术微沙龙成功在线举办

【动态】第二期CSIG文档图像分析与识别专业委员会学术微沙龙成功在线举办

中国图象图形学学会CSIG

0+阅读 · 2021年11月18日

【动态】第一期中国图象图形学学会文档图像学术微沙龙成功在线举办

【动态】第一期中国图象图形学学会文档图像学术微沙龙成功在线举办

中国图象图形学学会CSIG

0+阅读 · 2021年9月6日

CSIG云上微表情第十八期研讨会成功举办--结合深度学习的微表情检测方法

CSIG云上微表情第十八期研讨会成功举办--结合深度学习的微表情检测方法

CSIG机器视觉专委会

1+阅读 · 2021年8月3日

首届事理图谱研讨会7月20日在哈尔滨工业大学计算机学院成功举办

首届事理图谱研讨会7月20日在哈尔滨工业大学计算机学院成功举办

哈工大SCIR

13+阅读 · 2019年7月22日

相关基金

非线性组合优化暑期学校暨学术前沿研讨会

国家自然科学基金

6+阅读 · 2017年6月30日

华北克拉通破坏学术交流活动（第五阶段）

国家自然科学基金

6+阅读 · 2015年12月31日

中国数学会2015学术年会暨中国数学会成立八十周年纪念会

国家自然科学基金

0+阅读 · 2015年4月20日

华北克拉通破坏学术交流活动（第四阶段）

国家自然科学基金

0+阅读 · 2014年12月31日

带界面结构的一体化仿生骨软骨支架的研制及修复骨软骨缺损的实验研究

国家自然科学基金

0+阅读 · 2013年12月31日

双向梯度软骨支架的构建及关节软骨组织工程的实验研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于内容分析和行为分析的社区问答关键技术研究

国家自然科学基金

1+阅读 · 2012年12月31日

第六届全国动力学与控制青年学者学术研讨会

国家自然科学基金

0+阅读 · 2012年6月30日

自动化学科发展动态与基金项目成果报道

国家自然科学基金

0+阅读 · 2011年12月31日

承办数学天元基金学术领导小组2011年度第一次会议

国家自然科学基金

0+阅读 · 2011年4月30日

相关论文

Pronunciation-aware unique character encoding for RNN Transducer-based Mandarin speech recognition

Arxiv

0+阅读 · 2022年7月29日

Contrastive Masked Autoencoders are Stronger Vision Learners

Arxiv

0+阅读 · 2022年7月27日

GT4SD: Generative Toolkit for Scientific Discovery

Arxiv

0+阅读 · 2022年7月27日

Cascade Decoders-Based Autoencoders for Image Reconstruction

Arxiv

0+阅读 · 2022年7月27日

Adversarial and Contrastive Variational Autoencoder for Sequential Recommendation

Arxiv

17+阅读 · 2021年3月19日

Adversarial Mutual Information for Text Generation

Adversarial Mutual Information for Text Generation

Arxiv

13+阅读 · 2020年6月30日

Sequential Scenario-Specific Meta Learner for Online Recommendation

Sequential Scenario-Specific Meta Learner for Online Recommendation

Arxiv

16+阅读 · 2019年6月2日

Knowledge Representation Learning: A Quantitative Review

Knowledge Representation Learning: A Quantitative Review

Arxiv

28+阅读 · 2018年12月28日

Zero-Shot Object Detection by Hybrid Region Embedding

Arxiv

19+阅读 · 2018年5月17日

Learning over Knowledge-Base Embeddings for Recommendation

Arxiv

23+阅读 · 2018年3月22日

大家都在搜

大型语言模型

生成式人工智能

无人机系统

蓝牙安全攻防

朱克爱德华兹家族

【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络（DCRNN）

微信扫码咨询专知VIP会员