项目名称: 多文种文档图像识别的多层次马尔可夫随机场模型研究

项目编号: No.60872086

项目类型: 面上项目

立项/批准年度: 2009

项目学科: 无线电电子学、电信技术

项目作者: 彭良瑞

作者单位: 清华大学

项目金额: 30万元

中文摘要: 近年来,我国汉字及主要少数民族文字等现代印刷文档识别研究已取得重要成果。中华民族文化的信息化及国际化发展亟待更有效地解决多文种印刷及手写文档识别领域中的文种及文档类型扩展问题。本项目在原有研究尚未考虑的文档图像分割和识别统一建模方面,提出系统描述不同文种文档版面分析、文本行字切分和字符识别整个过程的多层次马尔可夫随机场(Hierachical Markov Random Field, HMRF)模型理论方法。研究内容为:对于不同体系文种,在图像页面、区域、文本行、字符多个层次上进行文档图像HMRF模型构造的方法;利用标记样本和大量实际未标记样本的半监督学习进行HMRF模型训练;利用已训练的模型对输入文档图像进行识别的优化求解方法。前期相关研究说明该理论方法具有可行性。研究难点为综合利用图像全局和局部信息以及先验知识来提高文档识别率;研究创新点为首次提出多种文档图像分割与识别的统一理论模型。

中文关键词: 多文种文档;图像识别;多层次马尔可夫随机场;半监督学习

英文摘要:

英文关键词:

成为VIP会员查看完整内容
1

相关内容

军事知识图谱构建技术
专知会员服务
125+阅读 · 2022年4月8日
专知会员服务
32+阅读 · 2021年10月8日
专知会员服务
167+阅读 · 2021年8月3日
专知会员服务
35+阅读 · 2021年6月16日
专知会员服务
60+阅读 · 2021年5月28日
【WWW2021】基于图层次相关性匹配信号的Ad-hoc 检索
专知会员服务
13+阅读 · 2021年2月25日
元强化学习综述及前沿进展
专知会员服务
61+阅读 · 2021年1月31日
[ICML2020]层次间消息传递的分子图学习
专知会员服务
33+阅读 · 2020年6月27日
自监督学习推动医学图像分类发展
TensorFlow
17+阅读 · 2021年12月6日
交叉描述:图像和文本的语义相似度
TensorFlow
2+阅读 · 2021年6月22日
深度学习与医学图像分析
人工智能前沿讲习班
40+阅读 · 2019年6月8日
生成对抗网络的研究进展与趋势
中国计算机学会
35+阅读 · 2018年11月14日
100+中文词向量,总有一款适合你
专知
12+阅读 · 2018年5月13日
实战 | 基于深度学习模型VGG的图像识别(附代码)
七月在线实验室
12+阅读 · 2018年3月30日
基于LDA的主题模型实践(一)
机器学习深度学习实战原创交流
20+阅读 · 2015年9月9日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
8+阅读 · 2008年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
One-Class Model for Fabric Defect Detection
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
1+阅读 · 2022年4月19日
Arxiv
21+阅读 · 2019年8月21日
Arxiv
22+阅读 · 2018年8月30日
小贴士
相关VIP内容
军事知识图谱构建技术
专知会员服务
125+阅读 · 2022年4月8日
专知会员服务
32+阅读 · 2021年10月8日
专知会员服务
167+阅读 · 2021年8月3日
专知会员服务
35+阅读 · 2021年6月16日
专知会员服务
60+阅读 · 2021年5月28日
【WWW2021】基于图层次相关性匹配信号的Ad-hoc 检索
专知会员服务
13+阅读 · 2021年2月25日
元强化学习综述及前沿进展
专知会员服务
61+阅读 · 2021年1月31日
[ICML2020]层次间消息传递的分子图学习
专知会员服务
33+阅读 · 2020年6月27日
相关资讯
自监督学习推动医学图像分类发展
TensorFlow
17+阅读 · 2021年12月6日
交叉描述:图像和文本的语义相似度
TensorFlow
2+阅读 · 2021年6月22日
深度学习与医学图像分析
人工智能前沿讲习班
40+阅读 · 2019年6月8日
生成对抗网络的研究进展与趋势
中国计算机学会
35+阅读 · 2018年11月14日
100+中文词向量,总有一款适合你
专知
12+阅读 · 2018年5月13日
实战 | 基于深度学习模型VGG的图像识别(附代码)
七月在线实验室
12+阅读 · 2018年3月30日
基于LDA的主题模型实践(一)
机器学习深度学习实战原创交流
20+阅读 · 2015年9月9日
相关基金
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
8+阅读 · 2008年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员