项目名称: 基于马尔科夫树与DRT的汉语句群自动划分算法研究
项目编号: No.61202281
项目类型: 青年科学基金项目
立项/批准年度: 2013
项目学科: 自动化技术、计算机技术
项目作者: 王荣波
作者单位: 杭州电子科技大学
项目金额: 22万元
中文摘要: 句群自动划分是自然语言处理中的重要课题,在机器翻译、篇章理解、信息检索等领域有广泛应用前景。针对现有汉语句群划分方法未充分利用句子上下文信息及句间关联信息的不足,本项目利用篇章表述理论(DRT)能动态地描述自然语言意义的特性,提出一种基于马尔科夫树和DRT理论的汉语句群自动划分方法。主要研究内容包括:(1)汉语句群构成特点分析;(2)汉语段落的马尔科夫树表示和句群自动划分算法;(3)DRT理论中篇章表述结构(DRS)构造算法;(4)DRT理论的语义解释模型。本项目研究的难点和核心问题在于构建马尔科夫树对汉语段落进行层次表示并利用动态规划算法实现句群自动划分,以及提出改进的DRS和语义解释模型对句群划分结果进行修正。本项目研究对于丰富汉语句群划分理论与方法,具有重要的建设性意义,同时为自然语言处理中从句法结构表示向语义形式表示转化提供了一种普适的方法,弥补了目前在语篇语义表征方法方面的不足。
中文关键词: 句群划分;篇章表述理论;马尔科夫树模型;汉语篇章分析;MDA
英文摘要: The automatic division of sentence group is a new important research topic in natural language processing domain which can be applied widely in machine translation, discourse understanding and information retrieval fields. Because the existing division me
英文关键词: Sentence Group Division;Discourse Representation Theory;Markov Tree Model;Chinese Discourse Analysis;