项目名称: 维吾尔语语素结构规则及其应用研究

项目编号: No.61163032

项目类型: 地区科学基金项目

立项/批准年度: 2012

项目学科: 自动化技术、计算机技术

项目作者: 艾克白尔·帕塔尔

作者单位: 新疆大学

项目金额: 49万元

中文摘要: 项目组将独立创建基于语素规律(语音规律、词法规律、句法规律)的统计模型和训练算法,实现适合粘性语言特点的关键性的处理算法,并在实际应用中验证和完善。实现高准确率的词性自动标注系统,文字校对系统。项目组将重点研究基于最大熵和CRF框架的算法的设计、维语独特的语言特征参数收集、归纳、检验,和基于SVM机的聚类算法实现和词性自动标注等内容。将维吾尔语语素规则的特征化分析方法分成三个主要研究任务进行:词的语素规律分析、词性标注、层次化统计分析。本项目的目的在于解决我国少数民族(特别是黏着语言)自然语言研究中的一大瓶颈。引入语素结构分析方法,对维语等粘性语言中非常有效。用小的训练语料库可以获得高的覆盖率,有效解决数据稀疏问题,提高了效率和模型的性能,更适合于非主流语言的自然语言处理研究工作。

中文关键词: 维吾尔语;词素结构;词干提取;文字校对;语言模型

英文摘要:

英文关键词: Uyghur;Morphological structure;Stemming;Proofreading;Language Model

成为VIP会员查看完整内容
0

相关内容

多语言语音识别声学模型建模方法最新进展
专知会员服务
32+阅读 · 2022年2月7日
专知会员服务
34+阅读 · 2021年8月19日
专知会员服务
97+阅读 · 2021年6月23日
专知会员服务
41+阅读 · 2021年6月21日
专知会员服务
119+阅读 · 2020年12月9日
多模态视觉语言表征学习研究综述
专知会员服务
191+阅读 · 2020年12月3日
专知会员服务
78+阅读 · 2020年8月4日
专知会员服务
219+阅读 · 2020年8月1日
最新《多任务学习》综述,39页pdf
专知会员服务
263+阅读 · 2020年7月10日
深度学习自然语言处理综述,266篇参考文献
专知会员服务
229+阅读 · 2019年10月12日
【党史学习】毛泽东重要论述(七)
中国图象图形学学会CSIG
0+阅读 · 2021年10月26日
基于规则的建模方法的可解释性及其发展
专知
4+阅读 · 2021年6月23日
云孚知识图谱YFKG:可自动扩充的知识图谱
哈工大SCIR
4+阅读 · 2021年4月23日
最新《多任务学习》综述,39页pdf
专知
28+阅读 · 2020年7月10日
一文了解成分句法分析
人工智能头条
15+阅读 · 2019年4月24日
自然语言处理(NLP)知识结构总结
AI100
51+阅读 · 2018年8月17日
迁移学习在深度学习中的应用
专知
23+阅读 · 2017年12月24日
刘志明 | 知识图谱及金融相关
开放知识图谱
13+阅读 · 2017年12月18日
赛尔原创 | 对话系统评价方法综述
哈工大SCIR
11+阅读 · 2017年11月13日
语音识别之--韩语语音识别
微信AI
15+阅读 · 2017年8月2日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月17日
小贴士
相关VIP内容
多语言语音识别声学模型建模方法最新进展
专知会员服务
32+阅读 · 2022年2月7日
专知会员服务
34+阅读 · 2021年8月19日
专知会员服务
97+阅读 · 2021年6月23日
专知会员服务
41+阅读 · 2021年6月21日
专知会员服务
119+阅读 · 2020年12月9日
多模态视觉语言表征学习研究综述
专知会员服务
191+阅读 · 2020年12月3日
专知会员服务
78+阅读 · 2020年8月4日
专知会员服务
219+阅读 · 2020年8月1日
最新《多任务学习》综述,39页pdf
专知会员服务
263+阅读 · 2020年7月10日
深度学习自然语言处理综述,266篇参考文献
专知会员服务
229+阅读 · 2019年10月12日
相关资讯
【党史学习】毛泽东重要论述(七)
中国图象图形学学会CSIG
0+阅读 · 2021年10月26日
基于规则的建模方法的可解释性及其发展
专知
4+阅读 · 2021年6月23日
云孚知识图谱YFKG:可自动扩充的知识图谱
哈工大SCIR
4+阅读 · 2021年4月23日
最新《多任务学习》综述,39页pdf
专知
28+阅读 · 2020年7月10日
一文了解成分句法分析
人工智能头条
15+阅读 · 2019年4月24日
自然语言处理(NLP)知识结构总结
AI100
51+阅读 · 2018年8月17日
迁移学习在深度学习中的应用
专知
23+阅读 · 2017年12月24日
刘志明 | 知识图谱及金融相关
开放知识图谱
13+阅读 · 2017年12月18日
赛尔原创 | 对话系统评价方法综述
哈工大SCIR
11+阅读 · 2017年11月13日
语音识别之--韩语语音识别
微信AI
15+阅读 · 2017年8月2日
相关基金
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员