项目名称: 基于依存图的汉语依存分析技术研究
项目编号: No.61170181
项目类型: 面上项目
立项/批准年度: 2012
项目学科: 自动化技术、计算机技术
项目作者: 陈家骏
作者单位: 南京大学
项目金额: 55万元
中文摘要: 依存文法对于语序灵活的汉语来说具有良好的描写能力,然而"投影性原则"使得依存树基本等价于短语结构树,没有充分体现出表示方法和分析精度的优势。为了摆脱这一限制,满足后续语义分析等应用的需要,本课题提出了基于"依存图"的汉语依存分析方法,重点研究两大问题:一是建立基于依存图的句法标注体系,给出基于原有树库的自动调整和转换方法,并研究与之相应的图搜索算法。另一方面,为了提高长句的分析精度和效率,引入浅层分析技术,使用组块分析捆绑短语使得句子扁平化,使用骨架分析识别长距离搭配以廓清句子结构;尝试用基于图的算法,将浅层分析和依存分析融合起来,最终给出实用的汉语依存图分析算法。
中文关键词: 依存分析;神经网络;联合结构;深度学习;自然语言处理
英文摘要:
英文关键词: dependency parsing;neural networks;coordinate structure;deep learning;natural language processing