成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
0
【动态】第四期CSIG文档图像分析与识别专业委员会学术微沙龙成功举办
2021 年 12 月 17 日
中国图象图形学学会CSIG
CSIG文档图像分析与识别专业委员会学术微沙龙(简称:文档图像微沙龙)在线学术报告会第四期于2021年12月7日成功举行。本沙龙由中国图象图形学学会主办,文档图像分析与识别专委会发起承办,中国图象图形学报协办。本期活动邀请现任百度视觉技术部资深研发工程师章成全分享报告: StrucTexT:一种字段级多模态特征增强的OCR结构化预训练模型。微沙龙活动在B站、蔻享学术,中国图像图形学报视频号进行了同步直播,人气峰值3000+。
本次活动由百度视觉技术部杰出研发架构师刘经拓主持,百度视觉技术部资深研发工程师章成全做了题为“StrucTexT: 一种字段级多模态特征增强的OCR结构化预训练模型”的学术报告。
报告从OCR行业发展和挑战升级作为切入点,展示了IPA时代下百度OCR结构化丰富的应用矩阵,介绍了OCR结构化的核心任务和对应的标准化解决方案组成要素。
通过总结和分析业界主流的OCR结构化各系列方案特点和当前瓶颈,引出StrucTexT设计的出发点和动机。
紧接着,对StrucTexT的结构设计、自监督预训练任务和下游任务建模方式展开详细的介绍。
通过丰富的比对实验,展示StrucTexT在支持三种OCR结构化类型任务的优势。
此外,通过更多的预训练数据和模型参数加持,StrucTexT在6项公开数据集或榜单任务刷新SOTA,也在百度多项实际业务数据中取得30%以上的相对错误率下降。
值得兴奋的是,StrucTexT通过github平台(https://github.com/PaddlePaddle/VIMER/tree/main/StrucTexT)正式启动对外开放。
最后,报告针对该领域在学术研究和落地应用遇到的瓶颈性问题,列举了OCR结构化相关的多个潜在可探索方向,并诚挚邀请广大研究者共同破局。
报告的论文 :
Li, Y.*, Qian, Y.*, Yu, Y.*, Qin, X., Zhang, C.+, Yao, K., … & Ding, E. “StrucTexT: Structured Text Understanding with Multi-Modal Transformers”. Accepted to ACM Multimedia 2021.
错过直播的同学可以前往B站观看回放视频,链接:
https://www.bilibili.com/video/BV13F411z7st?share_source=copy_web
来
源:
CSIG文档图像分析与识别专委会
中国图象图形学学会关于组织开展科技成果鉴定的通知
CSIG图像图形中国行承办方征集中
登录查看更多
点赞并收藏
0
暂时没有读者
0
权益说明
本文档仅做收录索引使用,若发现您的权益受到侵害,请立即联系客服(微信: zhuanzhi02,邮箱:bd@zhuanzhi.ai),我们会尽快为您处理
相关内容
图像分析
关注
1
【重磅】2022年IEEE Fellow出炉! 310位新晋升会士!王海峰、田永鸿、汪玉、申恒涛等七十九位华人当选!
专知会员服务
6+阅读 · 2021年11月24日
人工智能工程技术人员-国家职业技术技能标准
专知会员服务
36+阅读 · 2021年10月15日
【AAAI2021】面向真实世界的鲁棒视觉信息提取:新的数据集和新颖的解决方案
专知会员服务
21+阅读 · 2021年2月17日
面向健康的大数据与人工智能,103页ppt
专知会员服务
109+阅读 · 2020年12月29日
最新《自监督表示学习》报告,70页ppt
专知会员服务
85+阅读 · 2020年12月22日
【KDD2020】通用文档预训练模型LayoutLM:文档结构信息和视觉信息进行建模,让模型在预训练阶段进行多模态对齐。
专知会员服务
30+阅读 · 2020年8月23日
【CCF计算机视觉专委会】未来5-10年计算机视觉发展趋势,
专知会员服务
102+阅读 · 2020年5月20日
知识图谱融合方法,140页ppt,南京大学胡伟老师
专知会员服务
142+阅读 · 2020年2月19日
浅谈文字识别:新思考、新挑战及新机遇,华南理工大学金连文教授,VALSE2019: 让机器像人一样阅读:文字检测与识别新趋势
专知会员服务
25+阅读 · 2019年10月24日
2019年机器学习框架回顾
专知会员服务
35+阅读 · 2019年10月11日
【动态】CSIG云上微表情第26期研讨会成功举办
中国图象图形学学会CSIG
0+阅读 · 2022年4月12日
【动态】第五期CSIG文档图像分析与识别专业委员会学术微沙龙成功在线举办
中国图象图形学学会CSIG
0+阅读 · 2022年3月14日
【动态】第二届CSIG图像图形技术挑战赛圆满结束
中国图象图形学学会CSIG
1+阅读 · 2022年1月4日
【动态】CSIG多媒体计算学术会议青年论坛成功召开
中国图象图形学学会CSIG
0+阅读 · 2021年12月10日
【动态】第五届文档图像分析与识别前沿理论与应用研讨会暨中国图象图形学学会文档图像分析与识别专委会2021学术年会成功召开
中国图象图形学学会CSIG
0+阅读 · 2021年12月6日
【动态】第三期CSIG文档图像分析与识别专业委员会学术微沙龙成功在线举办
中国图象图形学学会CSIG
0+阅读 · 2021年11月18日
【动态】第二期CSIG文档图像分析与识别专业委员会学术微沙龙成功在线举办
中国图象图形学学会CSIG
0+阅读 · 2021年11月18日
【动态】第一期中国图象图形学学会文档图像学术微沙龙成功在线举办
中国图象图形学学会CSIG
0+阅读 · 2021年9月6日
【动态】CSIG图像图形中国行在大连理工大学成功举办
中国图象图形学学会CSIG
0+阅读 · 2021年8月6日
中国图象图形学学会机器视觉专委会2019年度会议成功召开
CSIG机器视觉专委会
0+阅读 · 2019年11月14日
华北克拉通破坏学术交流活动(第五阶段)
国家自然科学基金
5+阅读 · 2015年12月31日
华北克拉通破坏学术交流活动(第四阶段)
国家自然科学基金
0+阅读 · 2014年12月31日
流固耦合问题的并行数值模拟算法与应用
国家自然科学基金
0+阅读 · 2014年12月31日
海量形状数据的表示、分析与检索研究
国家自然科学基金
0+阅读 · 2013年12月31日
自由视点人体活动识别中的稀疏表达与学习
国家自然科学基金
0+阅读 · 2013年12月31日
手写中文文本识别的高扩展判别学习理论和方法
国家自然科学基金
0+阅读 · 2012年12月31日
胶囊内窥图像中病灶演化及其动态识别方法研究
国家自然科学基金
0+阅读 · 2012年12月31日
全国计算力学自主软件学术研讨会
国家自然科学基金
0+阅读 · 2012年9月30日
第一届中国食品科学青年论坛
国家自然科学基金
0+阅读 · 2012年8月29日
内容和结构化数据多维分析关键技术研究
国家自然科学基金
0+阅读 · 2010年12月31日
Small Promise CSPs that reduce to large CSPs
Arxiv
0+阅读 · 2022年4月19日
The 2020 Census Disclosure Avoidance System TopDown Algorithm
Arxiv
0+阅读 · 2022年4月19日
GestureLens: Visual Analysis of Gestures in Presentation Videos
Arxiv
0+阅读 · 2022年4月19日
Disturbance of questionable publishing to academia
Arxiv
0+阅读 · 2022年4月19日
Enabling hand gesture customization on wrist-worn devices
Arxiv
0+阅读 · 2022年4月19日
Reversible Gromov-Monge Sampler for Simulation-Based Inference
Arxiv
0+阅读 · 2022年4月18日
Guaranteed Nonlinear Tracking in the Presence of DNN-Learned Dynamics With Contraction Metrics and Disturbance Estimation
Arxiv
0+阅读 · 2022年4月18日
AI for human assessment: What do professional assessors need?
Arxiv
0+阅读 · 2022年4月18日
HFT-ONLSTM: Hierarchical and Fine-Tuning Multi-label Text Classification
Arxiv
0+阅读 · 2022年4月18日
A Logical Analysis of Dynamic Dependence
Arxiv
0+阅读 · 2022年4月16日
VIP会员
自助开通(推荐)
客服开通
详情
相关主题
图像分析
光学字符识别
结构化
预训练
多模态
预训练模型
相关VIP内容
【重磅】2022年IEEE Fellow出炉! 310位新晋升会士!王海峰、田永鸿、汪玉、申恒涛等七十九位华人当选!
专知会员服务
6+阅读 · 2021年11月24日
人工智能工程技术人员-国家职业技术技能标准
专知会员服务
36+阅读 · 2021年10月15日
【AAAI2021】面向真实世界的鲁棒视觉信息提取:新的数据集和新颖的解决方案
专知会员服务
21+阅读 · 2021年2月17日
面向健康的大数据与人工智能,103页ppt
专知会员服务
109+阅读 · 2020年12月29日
最新《自监督表示学习》报告,70页ppt
专知会员服务
85+阅读 · 2020年12月22日
【KDD2020】通用文档预训练模型LayoutLM:文档结构信息和视觉信息进行建模,让模型在预训练阶段进行多模态对齐。
专知会员服务
30+阅读 · 2020年8月23日
【CCF计算机视觉专委会】未来5-10年计算机视觉发展趋势,
专知会员服务
102+阅读 · 2020年5月20日
知识图谱融合方法,140页ppt,南京大学胡伟老师
专知会员服务
142+阅读 · 2020年2月19日
浅谈文字识别:新思考、新挑战及新机遇,华南理工大学金连文教授,VALSE2019: 让机器像人一样阅读:文字检测与识别新趋势
专知会员服务
25+阅读 · 2019年10月24日
2019年机器学习框架回顾
专知会员服务
35+阅读 · 2019年10月11日
热门VIP内容
开通专知VIP会员 享更多权益服务
【新书】解锁数据与生成型AI和RAG的结合:通过RAG将内部数据与大型语言模型集成,提升生成型AI系统的能力
强化学习增强的大型语言模型:综述
【CMU博士论文】学习匹配模型
浅谈多模态大模型幻觉缓解方法
相关资讯
【动态】CSIG云上微表情第26期研讨会成功举办
中国图象图形学学会CSIG
0+阅读 · 2022年4月12日
【动态】第五期CSIG文档图像分析与识别专业委员会学术微沙龙成功在线举办
中国图象图形学学会CSIG
0+阅读 · 2022年3月14日
【动态】第二届CSIG图像图形技术挑战赛圆满结束
中国图象图形学学会CSIG
1+阅读 · 2022年1月4日
【动态】CSIG多媒体计算学术会议青年论坛成功召开
中国图象图形学学会CSIG
0+阅读 · 2021年12月10日
【动态】第五届文档图像分析与识别前沿理论与应用研讨会暨中国图象图形学学会文档图像分析与识别专委会2021学术年会成功召开
中国图象图形学学会CSIG
0+阅读 · 2021年12月6日
【动态】第三期CSIG文档图像分析与识别专业委员会学术微沙龙成功在线举办
中国图象图形学学会CSIG
0+阅读 · 2021年11月18日
【动态】第二期CSIG文档图像分析与识别专业委员会学术微沙龙成功在线举办
中国图象图形学学会CSIG
0+阅读 · 2021年11月18日
【动态】第一期中国图象图形学学会文档图像学术微沙龙成功在线举办
中国图象图形学学会CSIG
0+阅读 · 2021年9月6日
【动态】CSIG图像图形中国行在大连理工大学成功举办
中国图象图形学学会CSIG
0+阅读 · 2021年8月6日
中国图象图形学学会机器视觉专委会2019年度会议成功召开
CSIG机器视觉专委会
0+阅读 · 2019年11月14日
相关基金
华北克拉通破坏学术交流活动(第五阶段)
国家自然科学基金
5+阅读 · 2015年12月31日
华北克拉通破坏学术交流活动(第四阶段)
国家自然科学基金
0+阅读 · 2014年12月31日
流固耦合问题的并行数值模拟算法与应用
国家自然科学基金
0+阅读 · 2014年12月31日
海量形状数据的表示、分析与检索研究
国家自然科学基金
0+阅读 · 2013年12月31日
自由视点人体活动识别中的稀疏表达与学习
国家自然科学基金
0+阅读 · 2013年12月31日
手写中文文本识别的高扩展判别学习理论和方法
国家自然科学基金
0+阅读 · 2012年12月31日
胶囊内窥图像中病灶演化及其动态识别方法研究
国家自然科学基金
0+阅读 · 2012年12月31日
全国计算力学自主软件学术研讨会
国家自然科学基金
0+阅读 · 2012年9月30日
第一届中国食品科学青年论坛
国家自然科学基金
0+阅读 · 2012年8月29日
内容和结构化数据多维分析关键技术研究
国家自然科学基金
0+阅读 · 2010年12月31日
相关论文
Small Promise CSPs that reduce to large CSPs
Arxiv
0+阅读 · 2022年4月19日
The 2020 Census Disclosure Avoidance System TopDown Algorithm
Arxiv
0+阅读 · 2022年4月19日
GestureLens: Visual Analysis of Gestures in Presentation Videos
Arxiv
0+阅读 · 2022年4月19日
Disturbance of questionable publishing to academia
Arxiv
0+阅读 · 2022年4月19日
Enabling hand gesture customization on wrist-worn devices
Arxiv
0+阅读 · 2022年4月19日
Reversible Gromov-Monge Sampler for Simulation-Based Inference
Arxiv
0+阅读 · 2022年4月18日
Guaranteed Nonlinear Tracking in the Presence of DNN-Learned Dynamics With Contraction Metrics and Disturbance Estimation
Arxiv
0+阅读 · 2022年4月18日
AI for human assessment: What do professional assessors need?
Arxiv
0+阅读 · 2022年4月18日
HFT-ONLSTM: Hierarchical and Fine-Tuning Multi-label Text Classification
Arxiv
0+阅读 · 2022年4月18日
A Logical Analysis of Dynamic Dependence
Arxiv
0+阅读 · 2022年4月16日
大家都在搜
palantir
自主可控
大型语言模型
CMU博士论文
生成式人工智能
无人艇
洛克菲勒
张贤达
物流
GANLab 将GA
Top
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top