项目名称: 面向Web文本的因果知识获取方法研究
项目编号: No.61173063
项目类型: 面上项目
立项/批准年度: 2012
项目学科: 自动化技术、计算机技术
项目作者: 曹存根
作者单位: 中国科学院计算技术研究所
项目金额: 56万元
中文摘要: 常识获取一直被视为人工智能领域最重要和最困难的问题之一。在当前的研究中,其获取方式已逐步由人工编辑转向机器的半自动获取;面向的知识源也由人脑转向文本这一知识载体。 但是,目前的常识获取研究基本处于停滞状态,研究工作主要集中在获取上下位、整体部分等特殊关系;而对于因果知识这类重要的常识知识,尚未提出一个系统的获取和验证方法。已有工作一般是从封闭语料中获取因果知识,得到的知识数量较少,难以面向实际应用。 针对这些问题,在已有工作的基础上,本课题将系统地研究从Web上获取因果常识知识的理论和方法,具体包括:(1)因果知识的表示方法;(2)因果知识在Web文本中的表达方式;(3)适于因果常识挖掘的语料获取和清洗方法;(4)因果事件的抽取方法;(5)因果知识的验证方法;(6)因果知识的扩充方法。通过该研究,我们旨在获取一个面向应用的大规模事件因果网络。
中文关键词: 常识知识;文本挖掘;语义分类与描述;;
英文摘要:
英文关键词: commonsense knowledge;text mining;semantic taxonomy and description;;