Data is published on the web over time in great volumes, but majority of the data is unstructured, making it hard to understand and difficult to interpret. Information Extraction (IE) methods extract structured information from unstructured data. One of the challenging IE tasks is Event Extraction (EE) which seeks to derive information about specific incidents and their actors from the text. EE is useful in many domains such as building a knowledge base, information retrieval, summarization and online monitoring systems. In the past decades, some event ontologies like ACE, CAMEO and ICEWS were developed to define event forms, actors and dimensions of events observed in the text. These event ontologies still have some shortcomings such as covering only a few topics like political events, having inflexible structure in defining argument roles, lack of analytical dimensions, and complexity in choosing event sub-types. To address these concerns, we propose an event ontology, namely COfEE, that incorporates both expert domain knowledge, previous ontologies and a data-driven approach for identifying events from text. COfEE consists of two hierarchy levels (event types and event sub-types) that include new categories relating to environmental issues, cyberspace, criminal activity and natural disasters which need to be monitored instantly. Also, dynamic roles according to each event sub-type are defined to capture various dimensions of events. In a follow-up experiment, the proposed ontology is evaluated on Wikipedia events, and it is shown to be general and comprehensive. Moreover, in order to facilitate the preparation of gold-standard data for event extraction, a language-independent online tool is presented based on COfEE.


翻译:长期在网上公布大量数据,但大多数数据没有结构化,难以理解和解释。信息提取(IE)方法从非结构化数据中提取结构化信息。一个具有挑战性的IE任务是“Expleton”(EE),它试图从文本中获取具体事件及其行为者的信息。EE在许多领域非常有用,如建立知识库、信息检索、汇总和在线监测系统。在过去几十年中,开发了一些诸如ACE、CAMEO和ICEWS之类的事件,以界定在文本中观察到的事件的形式、行为者和层面。这些事件上仍然有一些缺陷,例如仅涵盖几个主题,如政治活动,在界定争论作用方面结构不灵活,缺乏分析层面,在选择事件子类型时复杂。为了解决这些问题,我们建议举办一个包含专家域知识、先前的CAMEO和ICEWS等内容的活动,在确定文本中所观察到的事件时采用的数据驱动方法。COFEEE包括两个层次层次的编制,在与动态事件相关的每一种类型和亚型活动上显示的排序,在与动态活动上显示的每个类型和亚型活动上显示的排序,在排序上显示的关于动态活动的排序上,在各种类型和亚型事件上显示的顺序上,在各种活动上显示的计算。

1
下载
关闭预览

相关内容

《计算机信息》杂志发表高质量的论文,扩大了运筹学和计算的范围,寻求有关理论、方法、实验、系统和应用方面的原创研究论文、新颖的调查和教程论文,以及描述新的和有用的软件工具的论文。官网链接:https://pubsonline.informs.org/journal/ijoc
【如何做研究】How to research ,22页ppt
专知会员服务
108+阅读 · 2021年4月17日
专知会员服务
42+阅读 · 2020年12月18日
因果图,Causal Graphs,52页ppt
专知会员服务
246+阅读 · 2020年4月19日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
103+阅读 · 2019年10月9日
已删除
inpluslab
8+阅读 · 2019年10月29日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
Rapid Customization for Event Extraction
Arxiv
7+阅读 · 2018年9月20日
VIP会员
相关资讯
已删除
inpluslab
8+阅读 · 2019年10月29日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
Top
微信扫码咨询专知VIP会员