高度结构化的文本使得文本知识的抽取和推断来的很容易,但是人类所遇到的大部分知识表达形式都是非结构化的文本信息,如何在非结构化的文本中有效地抽取知识一直是研究人员关注的重点。今天就为大家带来KDD2018文本知识提取与推断:浅层、深度和中间层次的最新教程。
编译:专知
下载方式
关注公众号,后台回复
20180828
摘要:
在过去十年中,结构化知识提取和推理系统取得了巨大进步。现代系统从人们,地点,组织和时间的分辨率的浅层语言标记和命名实体的粗粒度识别开始,将数十亿页的非结构化文本与包含总共有成千上万种类型,由成千上万的关系连接的数以亿计实体的知识图谱相连接。通过深度学习,这些系统可以构建单词,实体,类型和关系的连续表示,并使用它们不断发现新事实以添加到知图谱中,同时支持远远超出页面级“十个蓝色链接”的搜索系统”。我们将综合地介绍传统和深度知识提取和推理的最佳实践成果,跟踪它们的发展与相互关系,并指出各种松散的目标。
教程大纲:
第一部分
概述和动机
案例研究:NELL
Bootstrapped实体提取
开放式关系提取和规范化
第二部分
远程监督关系提取
知识图嵌入
总结
原文链接:
https://sites.google.com/site/keit2018kdd/