项目名称: 基于实例动态泛化的共指消解
项目编号: No.60975055
项目类型: 面上项目
立项/批准年度: 2010
项目学科: 自动化技术、计算机技术
项目作者: 秦兵
作者单位: 哈尔滨工业大学
项目金额: 30万元
中文摘要: 共指消解是指将篇章中同一实体对象的各种描述进行合并,是自然语言处理研究的重要课题。共指消解技术的研究对机器翻译、信息抽取、信息检索及自动文摘等自然语言处理领域都有积极的促进作用。但是目前在有限的训练语料上,基于规则和统计共指消解方法只能覆盖有限的高频实例,忽略了更多的低频实例的作用,并且在传统的方法上,一旦确定所采用规则或者模型,参数将不会根据样例类别或特性自适应调整,缺乏灵活性。针对上述问题,本课题提出了基于实例动态泛化的共指消解研究框架,该方法充分利用高频实例的同时尽可能发挥低频实例的经验性作用,针对测试实例自适应的进行最优泛化点判定,从而可以大幅提高共指消解的指标。该课题主要研究内容如下:共指句法和背景语义的特征的提取及共指实例的候选泛化点生成技术;泛化点动态匹配算法的探索和研究;共指实例的高效索引及检索技术;共指结果合并中矛盾消解技术以及共指消解研究的开放源码程序包的设计与共享。
中文关键词: 共指消解;实例检索;动态泛化;Mention识别;
英文摘要:
英文关键词: coreference resolution;instance retrieval;dynamic generalization;mention identification;