项目名称: 汉语句法分析中的自动歧义识别和分类问题研究

项目编号: No.61300158

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 自动化技术、计算机技术

项目作者: 黄书剑

作者单位: 南京大学

项目金额: 23万元

中文摘要: 高效的信息处理应用需要有效的文本的自动分析和理解方法,句法分析是文本分析体系中的重要环节。句法分析效果在实际应用中仍然难以让人满意,这主要是由于对句法结构歧义的处理错误导致的。句法结构歧义是指存在相同或相似的句子片段对应多个不同的句法结构的情况。以往的研究大多关注于部分歧义实例的消解、某个具体的歧义问题或特定的语义资源的使用,缺乏通用的歧义处理手段。本项目拟研究在自动句法分析中的歧义识别方法以及面向消解过程的歧义分类方法。首先采用不确定性分析的技术对句法分析中影响分析效果的关键性歧义自动识别;然后结合语言学的歧义理论,根据消解这些歧义所需要的不同上下文和语义知识来源对歧义进行分类,为自动的歧义消解提供依据。

中文关键词: 句法分析;歧义识别;歧义消解;;

英文摘要: Efficient information processing applications often require effective methods to automatically analyze and understand the text. Syntactic analysis, or parsing, is an important step of the text analysis pipeline. However, the parsing result of real world applications is usually not good enough. An important factor of parsing errors is the structural ambiguity. Structural ambiguity refers to the presence of multiple syntactic structures for the same or similar sentence fragments. Most of the previous studies focus on the theoretical issues, the analysis of given ambiguous instances or the application of a certain linguistic resource. In this project we plan to study methods for automatically identifying and classifying structural ambiguities. We firstly identify structural ambiguities using uncertainty measures. Then we classify these ambiguities into different categories according to the context or linguistic resources requires to solve them. These identification and classification results may leads to specific resolution techniques for a certain ambiguity type and better resolution result.

英文关键词: Syntactic Parsing;Ambiguity Recognition;Ambiguity Resolution;;

成为VIP会员查看完整内容
0

相关内容

句法分析(Parsing)就是指对句子中的词语语法功能进行分析,比如“我来晚了”,这里“我”是主语,“来”是谓语,“晚了”是补语。 句法分析(syntactic parsing)是对输入的文本句子进行分析以得到句子的句法结构的处理过程。对句法结构进行分析,一方面是语言理解的自身需求,句法分析是语言理解的重要一环,另一方面也为其它自然语言处理任务提供支持。例如句法驱动的统计机器翻译需要对源语言或目标语言(或者同时两种语言)进行句法分析;语义分析通常以句法分析的输出结果作为输入以便获得更多的指示信息。
自然语言处理中的文本表示研究
专知会员服务
56+阅读 · 2022年1月10日
专知会员服务
24+阅读 · 2021年7月17日
专知会员服务
35+阅读 · 2021年6月16日
专知会员服务
29+阅读 · 2020年9月18日
专知会员服务
24+阅读 · 2020年9月11日
专知会员服务
199+阅读 · 2020年3月6日
深度学习自然语言处理综述,266篇参考文献
专知会员服务
229+阅读 · 2019年10月12日
自然语言处理中的文本表示研究
专知
0+阅读 · 2022年1月10日
哈工大|NLP数据增强方法?我有15种
哈工大SCIR
1+阅读 · 2021年10月13日
一文读懂依存句法分析
AINLP
16+阅读 · 2019年4月28日
一文了解成分句法分析
人工智能头条
15+阅读 · 2019年4月24日
别说还不懂依存句法分析
人工智能头条
23+阅读 · 2019年4月8日
学会原创 | 自然语言的语义表示学习方法与应用
中国人工智能学会
11+阅读 · 2019年3月7日
中文NLP用什么?中文自然语言处理的完整机器处理流程
人工智能头条
61+阅读 · 2018年9月5日
情感分析的新方法,使用word2vec对微博文本进行情感分析和分类
数据挖掘入门与实战
22+阅读 · 2018年1月6日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月16日
Hierarchical Graph Capsule Network
Arxiv
20+阅读 · 2020年12月16日
小贴士
相关VIP内容
自然语言处理中的文本表示研究
专知会员服务
56+阅读 · 2022年1月10日
专知会员服务
24+阅读 · 2021年7月17日
专知会员服务
35+阅读 · 2021年6月16日
专知会员服务
29+阅读 · 2020年9月18日
专知会员服务
24+阅读 · 2020年9月11日
专知会员服务
199+阅读 · 2020年3月6日
深度学习自然语言处理综述,266篇参考文献
专知会员服务
229+阅读 · 2019年10月12日
相关资讯
自然语言处理中的文本表示研究
专知
0+阅读 · 2022年1月10日
哈工大|NLP数据增强方法?我有15种
哈工大SCIR
1+阅读 · 2021年10月13日
一文读懂依存句法分析
AINLP
16+阅读 · 2019年4月28日
一文了解成分句法分析
人工智能头条
15+阅读 · 2019年4月24日
别说还不懂依存句法分析
人工智能头条
23+阅读 · 2019年4月8日
学会原创 | 自然语言的语义表示学习方法与应用
中国人工智能学会
11+阅读 · 2019年3月7日
中文NLP用什么?中文自然语言处理的完整机器处理流程
人工智能头条
61+阅读 · 2018年9月5日
情感分析的新方法,使用word2vec对微博文本进行情感分析和分类
数据挖掘入门与实战
22+阅读 · 2018年1月6日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员