项目名称: 网络下的西夏文及西夏文献处理研究

项目编号: No.60803104

项目类型: 青年科学基金项目

立项/批准年度: 2009

项目学科: 金属学与金属工艺

项目作者: 柳长青

作者单位: 宁夏大学

项目金额: 19万元

中文摘要: 当前随着西夏学研究的不断深入,网络下的西夏文及西夏文献计算机数字化和文本化,并对数字化、文本化的文献进行查询与检索具有重要的意义。本课题主要利用计算机研究西夏文献数字化整理的解决方法和实现技术,最终实现西夏文献数字化资源平台。该平台可实现西夏文的网页显示和西夏文献的文本化及西夏文关键字在西夏文献数字化资源中的精确定位和字库、文献资源的快速更新与发布。通过本课题的研究可以探索少数民族古籍文献的计算机研究方法和计算机科学技术与人文社会科学相互交叉、相互结合的研究方法。本课题在已有的工作基础上,首先建立了西夏古籍字库,该字库中的西夏字字形完全来自西夏古籍文献,其每个西夏字形均来自于已公布的西夏文献,能够真实反映西夏字的本质特征,整体结构未经人为美化与修饰。该字库是目前唯一严格按照原始文献制作的西夏字库。还讨论了西夏字字形结构特点及与汉字的比较。通过建立智能西夏文四角号码输入法大大提高了西夏文的录入速度。利用计算机图形图像处理技术对《俄藏黑水城西夏文献》进行了图像预处理及切割操作。通过人工与计算机处理相结合的方法进行了西夏文献的文本化。最后利用西夏文献数据库实现了西夏文电子字典的应用实例。

中文关键词: 西夏文献; 数字化; 西夏文;西夏古籍字库;西夏数据库

英文摘要: As Xixia Studies has been well developed during past decades, the digitalization of Xixia characters and documents along with text-based literature index is of great significance. This project aims to achieve digitalization of Xixia documents and construct Xixia literature digital resources platform. The platform enables the Xixia web page display Xixia literature, search Xixia literature by using keyboard digital resources, precise positioning and font, enabling document resources quickly update and publish. Ethnic ancient books and documents, computer research methods and computer science and technology intersect with the humanities and social sciences through the study of this subject can explore the combination of research methods. This subject in the existing work based on the first established Xia Xia ancient fonts, Xixia characters in the font glyphs entirely from Xixia ancient literature, Xixia characters shaped from Xixia literature published, can truly reflect the essential characteristics of Xixia words, the overall structure without artificial beautification and modification. The font is produced only in strict accordance with the original literature of the Xixia font. Besides, the project also discusses Xixia characters shaped structural characteristics and comparison with the Chinese characters. Four-corner intelligent input method of Xixia characters greatly improves the entry speed of Xixia characters. Based on computer graphics image processing technology, Russian Collection Heishuicheng XiXia literature is processed through a combination of manual and computer processing. Finally, a Xixia electronic dictionary is complied by using Xixia historical documents database.

英文关键词: Xixia historical documents; digitalization; Xixia characters; Xixia ancient font; Xixia Database

成为VIP会员查看完整内容
0

相关内容

专知会员服务
27+阅读 · 2021年8月24日
专知会员服务
41+阅读 · 2021年7月24日
微软《神经语音合成》综述论文,63页pdf530篇文献
专知会员服务
30+阅读 · 2021年7月3日
专知会员服务
72+阅读 · 2021年5月21日
专知会员服务
81+阅读 · 2021年2月16日
基于事件社会网络推荐系统综述
专知会员服务
70+阅读 · 2021年1月13日
专知会员服务
46+阅读 · 2020年11月13日
专知会员服务
66+阅读 · 2020年9月24日
实体关系抽取方法研究综述
专知会员服务
178+阅读 · 2020年7月19日
一文带你了解语音信号处理技术
PaperWeekly
9+阅读 · 2022年1月26日
医学图像数据读取及预处理方法总结
极市平台
22+阅读 · 2022年1月4日
这十大科学文献最烂配图,你可千万别学
量子位
0+阅读 · 2021年12月6日
麻省理工学院给研究生的文献阅读方法,简单高效!
清华大学研究生教育
18+阅读 · 2019年9月8日
一文读懂文本处理中的对抗训练
PaperWeekly
22+阅读 · 2019年6月5日
网络舆情分析
计算机与网络安全
20+阅读 · 2018年10月18日
图像检索研究进展:浅层、深层特征及特征融合
中国计算机学会
122+阅读 · 2018年3月26日
如何做文献综述:克雷斯威尔五步文献综述法
清华大学研究生教育
21+阅读 · 2017年7月10日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月18日
2D Human Pose Estimation: A Survey
Arxiv
0+阅读 · 2022年4月15日
Arxiv
10+阅读 · 2018年2月17日
Arxiv
11+阅读 · 2018年1月15日
小贴士
相关VIP内容
专知会员服务
27+阅读 · 2021年8月24日
专知会员服务
41+阅读 · 2021年7月24日
微软《神经语音合成》综述论文,63页pdf530篇文献
专知会员服务
30+阅读 · 2021年7月3日
专知会员服务
72+阅读 · 2021年5月21日
专知会员服务
81+阅读 · 2021年2月16日
基于事件社会网络推荐系统综述
专知会员服务
70+阅读 · 2021年1月13日
专知会员服务
46+阅读 · 2020年11月13日
专知会员服务
66+阅读 · 2020年9月24日
实体关系抽取方法研究综述
专知会员服务
178+阅读 · 2020年7月19日
相关资讯
一文带你了解语音信号处理技术
PaperWeekly
9+阅读 · 2022年1月26日
医学图像数据读取及预处理方法总结
极市平台
22+阅读 · 2022年1月4日
这十大科学文献最烂配图,你可千万别学
量子位
0+阅读 · 2021年12月6日
麻省理工学院给研究生的文献阅读方法,简单高效!
清华大学研究生教育
18+阅读 · 2019年9月8日
一文读懂文本处理中的对抗训练
PaperWeekly
22+阅读 · 2019年6月5日
网络舆情分析
计算机与网络安全
20+阅读 · 2018年10月18日
图像检索研究进展:浅层、深层特征及特征融合
中国计算机学会
122+阅读 · 2018年3月26日
如何做文献综述:克雷斯威尔五步文献综述法
清华大学研究生教育
21+阅读 · 2017年7月10日
相关基金
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员