项目名称: 面向移动阅读的复杂文档图像理解方法研究

项目编号: No.61300061

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 自动化技术、计算机技术

项目作者: 王勇涛

作者单位: 北京大学

项目金额: 23万元

中文摘要: 如何自动地将漫画书、文娱和体育类报刊等复杂版面出版物制作成适合于移动阅读的数字内容,是目前移动阅读发展所面临的瓶颈问题。复杂文档图像理解的目的,是实现这类出版物页面图像各构成对象的自动提取以及它们的阅读先后顺序的自动辨识,从而解决该瓶颈问题。现有的文档图像理解方法通常针对以文字为主体的文档图像,孤立地使用某个图像分析处理算法,局限性较大,无法处理这类包含大量的图形图像而且排版布局相对复杂的文档图像。本项目拟借鉴当前自然图像理解方法,使用能量最小化模型,研究一种更为通用有效的复杂文档图像理解方法。具体地,本项目将通过设计新的能量最小化函数及相应的优化算法,充分地使用相关先验知识,完成复杂文档图像理解中的多种构成对象提取任务以及不同构成对象联合识别任务。本项目研究成果将弥补现有文档图像理解方法的缺陷,为移动阅读内容制作提供关键技术支持,促进国内外移动阅读发展,因此本项目具有十分重要的研究意义。

中文关键词: 复杂文档图像理解;移动阅读;漫画分镜分割;立体几何对象三维重建;

英文摘要: How to automatically convert entertaining publications such as comic books and sports magazines into digital contents that are suitable to display on mobile devices is the bottleneck problem of mobile reading. Complex document image understanding aims to solve this problem by automatically detecting each object that composes the whole image page and then indentifying their reading orders. The existing document image understanding methods are specifically designed to process the document images mainly composed of texts, and solely exploit certain image processing algorithm, thus can't handle such kind of complex document image which mainly consists of graphics with complex layout. This project aims to propose a new more general and efficient document image understanding method by using the methodology of the state-of-the-art natural image understanding and the energy minimization method. In detail, the proposed method shall conduct the tasks of object detection and joint recognition for multiple detected objects by developing the new energy minimization function and the corresponding optimization algorithms. It is expected to overcome the drawbacks of the existing document understanding method, and provide key technical support for producing mobile reading contents, thus promote the development of both domestic a

英文关键词: complex document image understanding;mobile reading;comic panel detection;solid geometric object reconstruction;

成为VIP会员查看完整内容
0

相关内容

专知会员服务
31+阅读 · 2021年10月11日
专知会员服务
59+阅读 · 2021年5月28日
专知会员服务
69+阅读 · 2021年3月29日
专知会员服务
69+阅读 · 2021年3月23日
专知会员服务
65+阅读 · 2020年12月24日
专知会员服务
110+阅读 · 2020年3月20日
 图像内容自动描述技术综述
专知会员服务
85+阅读 · 2019年11月17日
MSRA-万字综述 直击多模态文档理解
夕小瑶的卖萌屋
3+阅读 · 2021年12月28日
微软亚洲研究院提出多语言通用文档理解预训练模型LayoutXLM
微软研究院AI头条
2+阅读 · 2021年6月1日
图像描述生成研究进展
专知
1+阅读 · 2021年3月29日
最全综述 | 图像分割算法
极市平台
23+阅读 · 2019年6月23日
深度学习与医学图像分析
人工智能前沿讲习班
40+阅读 · 2019年6月8日
图像检索研究进展:浅层、深层特征及特征融合
中国计算机学会
122+阅读 · 2018年3月26日
基于图片内容的深度学习图片检索(一)
七月在线实验室
20+阅读 · 2017年10月1日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
8+阅读 · 2008年12月31日
Arxiv
66+阅读 · 2022年4月13日
Arxiv
15+阅读 · 2018年6月23日
小贴士
相关VIP内容
专知会员服务
31+阅读 · 2021年10月11日
专知会员服务
59+阅读 · 2021年5月28日
专知会员服务
69+阅读 · 2021年3月29日
专知会员服务
69+阅读 · 2021年3月23日
专知会员服务
65+阅读 · 2020年12月24日
专知会员服务
110+阅读 · 2020年3月20日
 图像内容自动描述技术综述
专知会员服务
85+阅读 · 2019年11月17日
相关资讯
MSRA-万字综述 直击多模态文档理解
夕小瑶的卖萌屋
3+阅读 · 2021年12月28日
微软亚洲研究院提出多语言通用文档理解预训练模型LayoutXLM
微软研究院AI头条
2+阅读 · 2021年6月1日
图像描述生成研究进展
专知
1+阅读 · 2021年3月29日
最全综述 | 图像分割算法
极市平台
23+阅读 · 2019年6月23日
深度学习与医学图像分析
人工智能前沿讲习班
40+阅读 · 2019年6月8日
图像检索研究进展:浅层、深层特征及特征融合
中国计算机学会
122+阅读 · 2018年3月26日
基于图片内容的深度学习图片检索(一)
七月在线实验室
20+阅读 · 2017年10月1日
相关基金
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
8+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员