项目名称: 基于叙事模式分析的无监督新闻事件语义抽取研究
项目编号: No.61202233
项目类型: 青年科学基金项目
立项/批准年度: 2013
项目学科: 自动化技术、计算机技术
项目作者: 冯岩松
作者单位: 北京大学
项目金额: 25万元
中文摘要: 新闻事件语义抽取是信息抽取研究中的热点问题之一,是大规模实时新闻数据管理研究中的关键一环。本课题针对传统新闻事件抽取工作对于人工标注数据的依赖问题提出建立一种针对新闻事件语义要素的自动分析模型,并尝试借助概率统计方法将多媒体语义信息融入到新闻语义要素中。贯穿本课题的一个中心思想是如何减少人工参与,更多地利用新闻资源庞大的数据规模来挖掘新闻事件的叙事模式,进而抽取核心事件的语义要素。本课题的主要研究内容包含以下四个方面:基于叙事模式的新闻事件分析研究、基于事件语义链的核心新闻事件识别研究、无监督新闻事件语义要素抽取研究以及针对多媒体新闻语义要素融合的研究。本项目通过对新闻进行事件语义层次上的重构实现对实时新闻数据的自动事件语义要素抽取,为自动构建知识库、基于事件的信息检索等高级应用打下坚实基础。
中文关键词: 信息抽取;新闻事件抽取;叙事模式;实体关系抽取;
英文摘要: As an area in information extraction, news event extraction is of great importance for the research of large scale real-time news data management, recommendation, automatic knowledge acquisition and other information retrieval related applications. Tradit
英文关键词: Information Extraction;News Event Extraction;Narrative Schema;Entity Relation Extraction;