项目名称: 多方法融合的蒙古文古籍图像检索技术研究

项目编号: No.61463038

项目类型: 地区科学基金项目

立项/批准年度: 2015

项目学科: 其他

项目作者: 魏宏喜

作者单位: 内蒙古大学

项目金额: 46万元

中文摘要: 蒙古文古籍文献是蒙古族传统文化的重要载体,也是中华民族文化遗产的重要组成部分。然而,蒙古文古籍文献作为不可再生的宝贵文化资源,大都被珍藏在博物馆、图书馆里,不允许随便翻阅,这不但影响了蒙古文古籍文献的利用与传播,还制约了少数民族文化的传承与发展。数字技术的飞速发展使得蒙古文古籍文献可以通过数字化的形式保存和共享,这为挖掘和利用蒙古文古籍提供了前提条件。本项目拟以具有代表性的蒙古文大藏经为对象,在识别方法与无识别方法相融合的技术框架下,从文字识别和词定位两个角度出发分别构建文本索引库和特征索引库,以实现蒙古文古籍图像的全文检索。为此本项目将重点研究单词图像恢复、自动文本标注、字元切分与识别、多特征组合表示与固定长度表示、多样例检索、多检索结果融合等关键问题。本项目的实施对挖掘和利用蒙古文古籍文献、繁荣和发展少数民族文化具有重要意义。

中文关键词: 蒙古文古籍;文档图像检索;文字识别;词定位;伪相关反馈

英文摘要: Ancient Mongolian documents is a kind of carrier for the traditional cultures of the Mongolian people. And they are also the important component of Chinese nation's cultural heritage. However, as a kind of non-renewable cultural resources, the ancient Mongolian documents are mostly protected in museums and libraries. So, it is difficult to make use of them. It not only influences the utilization and transmission for the ancient Mongolian documents, but also restricts the inheritance and development of the minority nationality's culture. With the development of digitization technique, more and more ancient Mongolian documents are converted into digital images so as to protect them as long as possible. And the digital images can be shared more conveniently. The above provides the precondition for mining and utilizing the ancient Mongolian documents. In this project, the Mongolian Tipitaka is considered as the research object. Our research framework is based on a combination strategy of the recognition-based method and the recognition-free method. The indexes will be constructed by the character recognition technology and the word spotting technology separately, which can realize the aim of retrieving the ancient Mongolian document images. Therefore, the key research contents include restoration and automatic text annotation for word images, representation by the mixed features with fixed-length, multi-instances retrieval, data fusion for multiple ranking lists and so on. The project can play a very important part in mining and utilizing the ancient Mongolian documents. Moreover, it is very meaningful for promoting and developing the culture of minority nationality.

英文关键词: Ancient Mongolian Documents;Document Image Retrieval;Character Recognition;Word Spotting;Pseudo Relevance Feedback

成为VIP会员查看完整内容
0

相关内容

基于强化学习的推荐研究综述
专知会员服务
79+阅读 · 2021年10月21日
专知会员服务
7+阅读 · 2021年6月19日
专知会员服务
59+阅读 · 2021年4月16日
专知会员服务
31+阅读 · 2021年3月17日
专知会员服务
132+阅读 · 2021年1月13日
【博士论文】辨识性特征学习及在细粒度分析中的应用
专知会员服务
29+阅读 · 2020年12月10日
【博士论文】搜索引擎中的实体推荐关键技术研究
专知会员服务
42+阅读 · 2020年12月9日
专知会员服务
31+阅读 · 2020年9月2日
实体关系抽取方法研究综述
专知会员服务
174+阅读 · 2020年7月19日
新时期我国信息技术产业的发展
专知会员服务
68+阅读 · 2020年1月18日
人工智能与法律结合的现状及发展趋势
专知
2+阅读 · 2021年4月16日
一份超全的NLP语料资源集合及其构建现状
七月在线实验室
33+阅读 · 2019年1月16日
图像检索研究进展:浅层、深层特征及特征融合
中国计算机学会
122+阅读 · 2018年3月26日
领域应用 | 中医临床知识图谱的构建与应用
开放知识图谱
33+阅读 · 2017年12月12日
基于图片内容的深度学习图片检索(一)
七月在线实验室
20+阅读 · 2017年10月1日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
7+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月16日
Arxiv
0+阅读 · 2022年4月15日
Arxiv
16+阅读 · 2021年1月27日
小贴士
相关VIP内容
基于强化学习的推荐研究综述
专知会员服务
79+阅读 · 2021年10月21日
专知会员服务
7+阅读 · 2021年6月19日
专知会员服务
59+阅读 · 2021年4月16日
专知会员服务
31+阅读 · 2021年3月17日
专知会员服务
132+阅读 · 2021年1月13日
【博士论文】辨识性特征学习及在细粒度分析中的应用
专知会员服务
29+阅读 · 2020年12月10日
【博士论文】搜索引擎中的实体推荐关键技术研究
专知会员服务
42+阅读 · 2020年12月9日
专知会员服务
31+阅读 · 2020年9月2日
实体关系抽取方法研究综述
专知会员服务
174+阅读 · 2020年7月19日
新时期我国信息技术产业的发展
专知会员服务
68+阅读 · 2020年1月18日
相关资讯
人工智能与法律结合的现状及发展趋势
专知
2+阅读 · 2021年4月16日
一份超全的NLP语料资源集合及其构建现状
七月在线实验室
33+阅读 · 2019年1月16日
图像检索研究进展:浅层、深层特征及特征融合
中国计算机学会
122+阅读 · 2018年3月26日
领域应用 | 中医临床知识图谱的构建与应用
开放知识图谱
33+阅读 · 2017年12月12日
基于图片内容的深度学习图片检索(一)
七月在线实验室
20+阅读 · 2017年10月1日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
7+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
相关论文
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月16日
Arxiv
0+阅读 · 2022年4月15日
Arxiv
16+阅读 · 2021年1月27日
微信扫码咨询专知VIP会员