信息抽取 (Information Extraction: IE)是把文本里包含的信息进行结构化处理,变成表格一样的组织形式。输入信息抽取系统的是原始文本,输出的是固定格式的信息点。信息点从各种各样的文档中被抽取出来,然后以统一的形式集成在一起。这就是信息抽取的主要任务。信息以统一的形式集成在一起的好处是方便检查和比较。 信息抽取技术并不试图全面理解整篇文档,只是对文档中包含相关信息的部分进行分析。至于哪些信息是相关的,那将由系统设计时定下的领域范围而定。

精品内容

ACL2024 | IEPILE:大规模基于Schema的信息抽取语料库
专知会员服务
31+阅读 · 6月20日
时空知识图谱研究进展与展望
专知会员服务
79+阅读 · 2023年7月7日
「基于深度学习的实体关系联合抽取」研究综述
专知会员服务
42+阅读 · 2023年7月5日
专知会员服务
86+阅读 · 2021年9月4日
专知会员服务
37+阅读 · 2021年5月14日
专知会员服务
111+阅读 · 2021年1月8日
专知会员服务
195+阅读 · 2020年10月14日
微信扫码咨询专知VIP会员