项目名称: 基于Web及知识获取的无指导汉语词义消歧技术研究

项目编号: No.60903063

项目类型: 青年科学基金项目

立项/批准年度: 2010

项目学科: 无线电电子学、电信技术

项目作者: 刘鹏远

作者单位: 北京语言大学

项目金额: 17万元

中文摘要: 词义消歧是很多相关研究领域的一项困难而又重要的基础课题。由于有指导方法所能处理的词汇有限,无指导词义消歧近年来得到了普遍关注,而知识的自动获取是无指导消歧方法的关键。同时,Web资源在计算语言学领域的应用已经越来越受到重视并取得了很好的效果。本课题提出了基于Web及知识获取的无指导汉语词义消歧技术研究方法:1)将汉语词汇基于所需不同消歧知识进行一定粒度的分类;2)利用搜索引擎在Web及现有各类语义资源上进行词汇、句法及语义等不同层次消歧知识的自动获取;3)探求面向知识的特征选择,针对不同词汇类建立多知识源混合的消歧模型及消歧算法;4)在分治与自举的框架下,进行模型与算法优化及Web噪音过滤。目的在于寻求用最小资源与代价自动获取汉语词义消歧所必须的各类有效信息,排除知识获取过程中出现的Web噪音干扰,建立适合该无指导体系的词义消歧模型,缓解数据稀疏,最终给出实用的汉语词义消歧无指导解决方案。

中文关键词: 词义消歧;特征选择;ngram;知识获取;semeval

英文摘要:

英文关键词: word sense diambiguation;feature selection;ngram;knowledge acquisition;semeval

成为VIP会员查看完整内容
0

相关内容

【Chen Guanyi博士论文】汉语名词短语的计算生成,282页pdf
知识增强的文本生成研究进展
专知会员服务
96+阅读 · 2021年3月6日
【AAAI2021】知识图谱增强的预训练模型的生成式常识推理
专知会员服务
55+阅读 · 2020年12月20日
专知会员服务
189+阅读 · 2020年10月14日
【干货】多文本人脸生成
中国图象图形学学会CSIG
2+阅读 · 2021年12月14日
文本情感分析方法研究综述
专知
4+阅读 · 2021年4月20日
中文自然语言处理入门实战
人工智能头条
14+阅读 · 2019年1月11日
自然语言处理(NLP)知识结构总结
AI100
51+阅读 · 2018年8月17日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Identity-aware Graph Neural Networks
Arxiv
14+阅读 · 2021年1月25日
Arxiv
38+阅读 · 2020年12月2日
Arxiv
28+阅读 · 2018年4月6日
小贴士
相关VIP内容
【Chen Guanyi博士论文】汉语名词短语的计算生成,282页pdf
知识增强的文本生成研究进展
专知会员服务
96+阅读 · 2021年3月6日
【AAAI2021】知识图谱增强的预训练模型的生成式常识推理
专知会员服务
55+阅读 · 2020年12月20日
专知会员服务
189+阅读 · 2020年10月14日
相关基金
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员