项目名称: 汉语篇章结构分析的资源建设与计算模型研究

项目编号: No.61273320

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 自动化技术、计算机技术

项目作者: 周国栋

作者单位: 苏州大学

项目金额: 81万元

中文摘要: 篇章结构分析针对篇章的连贯性,是篇章级语义分析的基础。目前自然语言处理研究的重点聚焦在词法和句法层面,对篇章内在规律的研究相对较少,缺乏对篇章进行有效分析的理论和计算方法,从而严重制约了基于篇章的相关应用。本项目将从理论体系完善、语料库构建和计算模型研究等方面系统开展汉语篇章结构分析的研究:1)从研究汉语篇章结构组织的规律和特点入手,建立一套适用于汉语篇章结构表示与分析的理论体系。拟采用一种连接依存树的形式表示汉语的篇章结构,并基于连接词构建汉语的篇章关系体系。2)提出一套汉语篇章结构标注规范,并结合自举学习和主动学习方法半自动构建一定规模的高质量汉语篇章结构标注资源。3)以子句为基本单位,自底向上,借鉴依存句法分析算法,分析篇章中的层次结构及各组成成分之间的结构关系。有指导性和无指导性方法双管齐下,重点解决隐式(连接词缺省)篇章结构关系的识别。

中文关键词: 篇章级语义分析;篇章级结构分析;篇章连接依存树;汉语篇章结构表示机制;汉语篇章结构分析器

英文摘要: Discourse structure analysis deals with discourse coherence and is fundamental to discourse-level semantic analysis. Currently, most of research in NLP focuses on morphological and syntactic levels and there is much less research on the inherent regulations in discourse. This results in the lack of theoretical and computational methodologes towards effective discourse analysis and serevely restricts its wide applications. This project addresses Chinese discourse structure analysis from following aspects: 1)Studying the general regulations and special characteristics in the structure organization of Chinese discourses and building a theretical framework suitable to the representation and analysis of Chinese discourse structures. Specially, a connective-driven depepdency tree structure is proposed to represent Chinese discourse structures and a Chinese discourse relationship framework will be constructed on connectives. 2)Proposing a annotation scheme for Chinese discourse structures and semi-automatically building a certain-scale high-quality annotated Chinese discourse structure corpus by integrating bootstrapping and co-training. 3)Proposing a bottom-up approach to parse the hierarchical structure in a Chinese discourse and the structure relationship between its compomnents. Specially, both supervised and u

英文关键词: discourse-level semantic analysis;discourse-level structural analysis;discourse-level connective-driven dependency tree;Chinese discourse structure representation scheme;Chinese discourse structure analyzer

成为VIP会员查看完整内容
0

相关内容

中国面向人工智能的数据治理行业研究报告,76页ppt
专知会员服务
90+阅读 · 2022年3月29日
【博士论文】分形计算系统
专知会员服务
33+阅读 · 2021年12月9日
专知会员服务
47+阅读 · 2021年8月28日
专知会员服务
13+阅读 · 2021年1月18日
专知会员服务
55+阅读 · 2020年12月20日
稀缺资源语言神经网络机器翻译研究综述
专知会员服务
26+阅读 · 2020年12月2日
专知会员服务
27+阅读 · 2020年9月9日
知识图谱本体结构构建论文合集
专知会员服务
106+阅读 · 2019年10月9日
一文读懂依存句法分析
AINLP
16+阅读 · 2019年4月28日
一文了解成分句法分析
人工智能头条
15+阅读 · 2019年4月24日
别说还不懂依存句法分析
人工智能头条
23+阅读 · 2019年4月8日
一份超全的NLP语料资源集合及其构建现状
七月在线实验室
33+阅读 · 2019年1月16日
中文NLP用什么?中文自然语言处理的完整机器处理流程
人工智能头条
61+阅读 · 2018年9月5日
自然语言处理(NLP)知识结构总结
AI100
51+阅读 · 2018年8月17日
语料库构建——自然语言理解的基础
计算机研究与发展
11+阅读 · 2017年8月21日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
28+阅读 · 2021年10月1日
Arxiv
24+阅读 · 2021年1月25日
Arxiv
11+阅读 · 2019年6月19日
小贴士
相关VIP内容
中国面向人工智能的数据治理行业研究报告,76页ppt
专知会员服务
90+阅读 · 2022年3月29日
【博士论文】分形计算系统
专知会员服务
33+阅读 · 2021年12月9日
专知会员服务
47+阅读 · 2021年8月28日
专知会员服务
13+阅读 · 2021年1月18日
专知会员服务
55+阅读 · 2020年12月20日
稀缺资源语言神经网络机器翻译研究综述
专知会员服务
26+阅读 · 2020年12月2日
专知会员服务
27+阅读 · 2020年9月9日
知识图谱本体结构构建论文合集
专知会员服务
106+阅读 · 2019年10月9日
相关资讯
一文读懂依存句法分析
AINLP
16+阅读 · 2019年4月28日
一文了解成分句法分析
人工智能头条
15+阅读 · 2019年4月24日
别说还不懂依存句法分析
人工智能头条
23+阅读 · 2019年4月8日
一份超全的NLP语料资源集合及其构建现状
七月在线实验室
33+阅读 · 2019年1月16日
中文NLP用什么?中文自然语言处理的完整机器处理流程
人工智能头条
61+阅读 · 2018年9月5日
自然语言处理(NLP)知识结构总结
AI100
51+阅读 · 2018年8月17日
语料库构建——自然语言理解的基础
计算机研究与发展
11+阅读 · 2017年8月21日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
相关论文
微信扫码咨询专知VIP会员