项目名称: 自然语言处理中的覆盖域界定和聚焦点识别研究

项目编号: No.61272260

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 自动化技术、计算机技术

项目作者: 朱巧明

作者单位: 苏州大学

项目金额: 80万元

中文摘要: 覆盖域界定和聚焦点识别研究分别从作用面和作用点两个层面确定用户感兴趣的文本片断和关注对象,相互补充,相辅相成,在自然语言处理研究中具有广泛的应用价值,是实现句子级深层语义理解的重要基础之一。目前,覆盖域界定研究在建模和有效利用结构化句法信息的方面存在缺陷,聚焦点识别研究刚起步。本课题将在语言学理论指导下,从建模、结构化句法信息利用和数据不平衡问题研究等多个角度,深入研究自然语言处理中的覆盖域界定和聚焦点识别问题。主要研究内容包括:1)基于浅层语义分析的覆盖域界定模型;2)基于树核函数的覆盖域界定研究;3)基于竞争机制和中心理论的聚焦点识别研究;4)面向数据层面和算法层面的数据不平衡解决方案。同时,针对中文语料库缺乏问题,本课题将构建一定规模的高质量中文覆盖域界定和聚焦点识别语料库,深入开展中文覆盖域界定和聚焦点识别研究,缩短与英文相关研究的差距。

中文关键词: 否定;不确定;触发词检测;覆盖域界定;聚焦点识别

英文摘要: Scope determination deals with analyzing what part of a given sentence is under user's interest while focus identification further analyzes the specific object in which the user is mostly interested. As a fundamental issue in deep semantic parsing at sentence level, these two closely related and complementary tasks have many potential applications in natural language processing. The study of scope determination, however, currently focuses on chunking-based approaches and fails to effectively explore structured syntactic information while the research of focus identification just emerges. Within the guidance of linguistic theory, this project targets at the key issues of scope determination and focus identification from various aspects, such as computational modeling, exploring of structured syntactic information and managing of imbalanced data. The main content of this project includes: 1) a computational modeling framework for scope determination via shallow semantic parsing, 2) tree kernel-based scope determination, 3) focus identification using competition learning and centering theory, and 4) various solutions to imbalanced data from both data level and algorithm level. Last but not least, the project also aims to eliminate the performance gap between Chinese and English by constructing high-quality corpora

英文关键词: negation;speculation;cue detection;scope resolution;focus identification

成为VIP会员查看完整内容
0

相关内容

知识图谱研究现状及军事应用
专知会员服务
192+阅读 · 2022年4月8日
【课程】牛津大学&DeepMind《深度学习自然语言处理》课程
自然语言处理中的文本表示研究
专知会员服务
56+阅读 · 2022年1月10日
专知会员服务
18+阅读 · 2021年7月18日
专知会员服务
79+阅读 · 2021年7月3日
专知会员服务
127+阅读 · 2021年6月18日
专知会员服务
195+阅读 · 2020年10月14日
实体关系抽取方法研究综述
专知会员服务
176+阅读 · 2020年7月19日
最新《自然场景中文本检测与识别》综述论文,26页pdf
专知会员服务
69+阅读 · 2020年6月10日
基于知识图谱的行业问答系统搭建分几步?
PaperWeekly
2+阅读 · 2021年11月11日
阿里健康夺冠中文电子病历实体识别评测任务
AI掘金志
40+阅读 · 2018年8月17日
自然语言处理(NLP)知识结构总结
AI100
51+阅读 · 2018年8月17日
综述 | 知识图谱发展概述
PaperWeekly
75+阅读 · 2017年11月3日
【知识图谱】中文知识图谱构建方法研究
产业智能官
99+阅读 · 2017年10月26日
大规模知识图谱的构建、推理及应用
人工智能头条
15+阅读 · 2017年8月29日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月15日
Arxiv
17+阅读 · 2021年2月15日
Arxiv
14+阅读 · 2018年5月15日
小贴士
相关VIP内容
知识图谱研究现状及军事应用
专知会员服务
192+阅读 · 2022年4月8日
【课程】牛津大学&DeepMind《深度学习自然语言处理》课程
自然语言处理中的文本表示研究
专知会员服务
56+阅读 · 2022年1月10日
专知会员服务
18+阅读 · 2021年7月18日
专知会员服务
79+阅读 · 2021年7月3日
专知会员服务
127+阅读 · 2021年6月18日
专知会员服务
195+阅读 · 2020年10月14日
实体关系抽取方法研究综述
专知会员服务
176+阅读 · 2020年7月19日
最新《自然场景中文本检测与识别》综述论文,26页pdf
专知会员服务
69+阅读 · 2020年6月10日
相关资讯
基于知识图谱的行业问答系统搭建分几步?
PaperWeekly
2+阅读 · 2021年11月11日
阿里健康夺冠中文电子病历实体识别评测任务
AI掘金志
40+阅读 · 2018年8月17日
自然语言处理(NLP)知识结构总结
AI100
51+阅读 · 2018年8月17日
综述 | 知识图谱发展概述
PaperWeekly
75+阅读 · 2017年11月3日
【知识图谱】中文知识图谱构建方法研究
产业智能官
99+阅读 · 2017年10月26日
大规模知识图谱的构建、推理及应用
人工智能头条
15+阅读 · 2017年8月29日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员