项目名称: 基于在线百科和问答社区的中文文本蕴涵知识获取
项目编号: No.61163039
项目类型: 地区科学基金项目
立项/批准年度: 2012
项目学科: 计算机科学学科
项目作者: 张志昌
作者单位: 西北师范大学
项目金额: 47万元
中文摘要: 文本蕴涵,即一个文本(称为假设H)的意思可从另一个文本T中推断出来,称T蕴涵H,是自然语言处理研究中的难点和重点课题。文本蕴涵知识在蕴涵识别中有重要作用;相对英文,中文文本蕴涵方面的研究相对较少,积累的蕴涵知识资源不多。基于此,本项目提出利用在线百科和问答社区来获取中文文本蕴涵知识,主要特点和创新体现在: (1)通过对中文各种在线百科和问答社区进行分析,提出利用这两种网络资源来获取词汇/短语蕴涵规则、模板蕴涵规则、蕴涵文本对;(2)借助这两种资源,用替换和统计方法,将获取到的短语、模板等已有的蕴涵知识用于新的蕴涵规则生成,进一步增加蕴涵知识规模;(3)为蕴涵规则获取上下文语义约束条件,并给出规则本身的类别信息,为规则的正确应用提供坚实基础;(4)针对文本蕴涵知识评测的难题,提出借助在线百科和问答社区,进行面向应用的文本蕴涵知识人工和自动性能评价,并分析蕴涵知识对实际应用的具体效用。
中文关键词: 文本蕴涵;蕴涵知识;自动获取;蕴涵规则分类体系;性能评价
英文摘要:
英文关键词: textual entailment;entailment knowledge;automatic acquisition;category system of entailment rule;performance evaluation