信息抽取 (Information Extraction: IE)是把文本里包含的信息进行结构化处理,变成表格一样的组织形式。输入信息抽取系统的是原始文本,输出的是固定格式的信息点。信息点从各种各样的文档中被抽取出来,然后以统一的形式集成在一起。这就是信息抽取的主要任务。信息以统一的形式集成在一起的好处是方便检查和比较。 信息抽取技术并不试图全面理解整篇文档,只是对文档中包含相关信息的部分进行分析。至于哪些信息是相关的,那将由系统设计时定下的领域范围而定。
【NLP基础】信息抽取(Information Extraction:NER(命名实体识别),关系抽取)
深度学习自然语言处理
3+阅读 · 2020年2月11日
一文读懂命名实体识别
AINLP
31+阅读 · 2019年4月23日
征稿 | 国际KG大会IJCKG 2021投稿延期!推荐 SCI 一区期刊
开放知识图谱
0+阅读 · 2021年9月29日
关系提取简述
AINLP
2+阅读 · 2019年12月18日
ACL 2022 主会长文论文分类整理
RUC AI Box
4+阅读 · 2022年4月20日
CCF推荐 | 高引SCI期刊专刊信息5条
Call4Papers
2+阅读 · 2019年7月2日
中文自然语言处理相关资料集合指南
专知
18+阅读 · 2019年3月10日
本周 AI 论文良心推荐,你想 pick 谁?
PaperWeekly
0+阅读 · 2018年5月25日
【NLP】关系提取简述
深度学习自然语言处理
1+阅读 · 2019年12月20日
微信扫码咨询专知VIP会员