【干货书】大规模文本数据的结构化知识挖掘，200页pdf - 专知VIP

会员服务 ·

42

文本挖掘 · 知识挖掘 · 书籍 ·

2022 年 8 月 20 日

【干货书】大规模文本数据的结构化知识挖掘，200页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

现实世界的数据虽然庞大，但在很大程度上是非结构化的，以自然语言文本的形式存在。从大量的文本数据中挖掘结构，而不需要大量的人工注释和标记，这是一个挑战，但也是非常理想的。在这本书中，我们研究了从大量非结构化文本语料库中挖掘事实知识结构(例如，实体及其关系)的原则和方法。与许多现有的结构提取方法不同，现有的方法严重依赖于人工注释数据进行模型训练，我们的轻工作量方法利用存储在外部知识库中的人工管理事实作为远程监督，并利用大型文本语料库中的丰富数据冗余进行上下文理解。这种轻工作量挖掘方法为构建文本语料库带来了一系列新的原则和强大的方法，包括:(1)实体识别、打字和同义词发现;(2)实体关系抽取;(3)开放域属性值挖掘与信息提取。本书介绍了这一新的研究前沿，并指出了一些有前景的研究方向。

https://www.morganclaypool.com/doi/10.2200/S00860ED1V01Y201806DMK015

成为VIP会员查看完整内容

70

相关内容

文本挖掘

web挖掘的一个分支，用于从文本数据中获取有趣的信息和知识，主要用于信息检索、智能商务、生物信息技术等

【实用书】文本分析：非结构信息分析，259页pdf

【实用书】文本分析：非结构信息分析，259页pdf

专知会员服务

103+阅读 · 2022年7月5日

【干货书】机器学习文本分析: 从深度学习到Transformer，510页pdf

【干货书】机器学习文本分析: 从深度学习到Transformer，510页pdf

专知会员服务

122+阅读 · 2022年5月19日

UIUC韩家炜：从海量非结构化文本中挖掘结构化知识

UIUC韩家炜：从海量非结构化文本中挖掘结构化知识

专知会员服务

98+阅读 · 2021年12月30日

【干货书】语义关系与深度学习，86页pdf

专知会员服务

64+阅读 · 2021年2月4日

数据挖掘大拿韩家炜：从非结构化文本到知识立方TextCube：自动化构建和多维探索

数据挖掘大拿韩家炜：从非结构化文本到知识立方TextCube：自动化构建和多维探索

专知会员服务

101+阅读 · 2019年12月28日

UIUC韩家炜：从海量非结构化文本中挖掘结构化知识

UIUC韩家炜：从海量非结构化文本中挖掘结构化知识

专知

6+阅读 · 2021年12月30日

最新《知识驱动的文本生成》综述论文，44页pdf

最新《知识驱动的文本生成》综述论文，44页pdf

专知

25+阅读 · 2020年10月14日

【论文笔记】基于文本语料库中分类法学习的综述：问题、资源和最新进展

【论文笔记】基于文本语料库中分类法学习的综述：问题、资源和最新进展

专知

12+阅读 · 2019年10月13日

【KDD2019知识图谱教程】从海量文本中挖掘和构建异构信息网络，UIUC232页ppt

【KDD2019知识图谱教程】从海量文本中挖掘和构建异构信息网络，UIUC232页ppt

专知

15+阅读 · 2019年8月11日

自然语言处理常识推理综述论文，60页pdf

自然语言处理常识推理综述论文，60页pdf

专知

73+阅读 · 2019年4月4日

互联网环境下中文实体知识挖掘关键技术研究

国家自然科学基金

3+阅读 · 2012年12月31日

基于动作概念的本体知识库及在文本处理上的应用

国家自然科学基金

7+阅读 · 2012年12月31日

大规模非结构化数据的智能存储管理与检索关键技术

国家自然科学基金

6+阅读 · 2010年12月31日

基于主动学习的半监督领域本体自动构建

国家自然科学基金

4+阅读 · 2009年12月31日

文本语义模型和子空间聚类研究

国家自然科学基金

1+阅读 · 2009年12月31日

Performing live time-traversal queries on RDF datasets

Arxiv

0+阅读 · 2022年10月5日

Testing the simplifying assumption in high-dimensional vine copulas

Arxiv

0+阅读 · 2022年10月5日

Knowledge Unlearning for Mitigating Privacy Risks in Language Models

Arxiv

0+阅读 · 2022年10月4日

Construction and Applications of Open Business Knowledge Graph

Arxiv

0+阅读 · 2022年9月30日

Curriculum Learning: A Survey

Arxiv

24+阅读 · 2021年1月25日

VIP会员

相关主题

相关VIP内容

【实用书】文本分析：非结构信息分析，259页pdf

【实用书】文本分析：非结构信息分析，259页pdf

专知会员服务

103+阅读 · 2022年7月5日

【干货书】机器学习文本分析: 从深度学习到Transformer，510页pdf

【干货书】机器学习文本分析: 从深度学习到Transformer，510页pdf

专知会员服务

122+阅读 · 2022年5月19日

UIUC韩家炜：从海量非结构化文本中挖掘结构化知识

UIUC韩家炜：从海量非结构化文本中挖掘结构化知识

专知会员服务

98+阅读 · 2021年12月30日

【干货书】语义关系与深度学习，86页pdf

专知会员服务

64+阅读 · 2021年2月4日

数据挖掘大拿韩家炜：从非结构化文本到知识立方TextCube：自动化构建和多维探索

数据挖掘大拿韩家炜：从非结构化文本到知识立方TextCube：自动化构建和多维探索

专知会员服务

101+阅读 · 2019年12月28日

热门VIP内容

开通专知VIP会员享更多权益服务

【书籍】从零开始构建文本生成图像生成器：基于 Transformers 与扩散模型

人工智能与未来指挥

【伯克利博士论文】将大语言模型绑定至虚拟人格：实现人类行为模拟

稀疏自编码器综述：解释大语言模型的内部机制

相关资讯

UIUC韩家炜：从海量非结构化文本中挖掘结构化知识

UIUC韩家炜：从海量非结构化文本中挖掘结构化知识

专知

6+阅读 · 2021年12月30日

最新《知识驱动的文本生成》综述论文，44页pdf

最新《知识驱动的文本生成》综述论文，44页pdf

专知

25+阅读 · 2020年10月14日

【论文笔记】基于文本语料库中分类法学习的综述：问题、资源和最新进展

【论文笔记】基于文本语料库中分类法学习的综述：问题、资源和最新进展

专知

12+阅读 · 2019年10月13日

【KDD2019知识图谱教程】从海量文本中挖掘和构建异构信息网络，UIUC232页ppt

【KDD2019知识图谱教程】从海量文本中挖掘和构建异构信息网络，UIUC232页ppt

专知

15+阅读 · 2019年8月11日

自然语言处理常识推理综述论文，60页pdf

自然语言处理常识推理综述论文，60页pdf

专知

73+阅读 · 2019年4月4日

相关基金

互联网环境下中文实体知识挖掘关键技术研究

国家自然科学基金

3+阅读 · 2012年12月31日

基于动作概念的本体知识库及在文本处理上的应用

国家自然科学基金

7+阅读 · 2012年12月31日

大规模非结构化数据的智能存储管理与检索关键技术

国家自然科学基金

6+阅读 · 2010年12月31日

基于主动学习的半监督领域本体自动构建

国家自然科学基金

4+阅读 · 2009年12月31日

文本语义模型和子空间聚类研究

国家自然科学基金

1+阅读 · 2009年12月31日

相关论文

Performing live time-traversal queries on RDF datasets

Arxiv

0+阅读 · 2022年10月5日

Testing the simplifying assumption in high-dimensional vine copulas

Arxiv

0+阅读 · 2022年10月5日

Knowledge Unlearning for Mitigating Privacy Risks in Language Models

Arxiv

0+阅读 · 2022年10月4日

Construction and Applications of Open Business Knowledge Graph

Arxiv

0+阅读 · 2022年9月30日

Curriculum Learning: A Survey

Arxiv

24+阅读 · 2021年1月25日

微信扫码咨询专知VIP会员