项目名称: 基于动作概念的本体知识库及在文本处理上的应用
项目编号: No.61373031
项目类型: 面上项目
立项/批准年度: 2013
项目学科: 自动化技术、计算机技术
项目作者: 朱其立
作者单位: 上海交通大学
项目金额: 75万元
中文摘要: 海量的线上和线下自然语言文本数据中蕴藏着非常有价值的信息。知识是理解和处理文本数据的关键。过去,人们用手工或自动的方法构建了词典、词库和基于名词的分类知识库或本体知识库。但是仅靠名词和名词短语来理解文本是不够的。这是因为动词或广义上的动作在每个语句的语义中都起着关键作用。近年来语义角色标注(SRL)的研究试图自动地监测出语句中动词和它的参数的含义,但是这些监督式学习方法依赖人工编纂的语料,故而难以扩展。本项目中我们将谓语动词和动作看作一种概念,研究动作概念的理论以及如何从海量互联网数据上自动提取并构建一个以动作为中心的本体概念知识库。这一知识库可以掌握比SRL更细粒度、更广泛的动作语义。我们还将设计一种把动作自动映射到一个名词概念上的方法。这一过程被称为动作概念化。最后我们将在这些新技术的基础上开发若干经典文本处理应用,以展示动作概念知识库的用途和性能。
中文关键词: 动作;参数概念;语义角色;;
英文摘要: Much valuable information is hidden in the trove of massive natural language text data both online and offline. Knowledge is indispensible in understanding text. In the past, in addition to lexicons and thesauri, noun-based taxonomies or ontologies have b
英文关键词: action;argument concept;semantic role;;