【新书】自然语言处理嵌入：语义向量表示理论与进展，从Word2Vec到BERT，163页pdf - 专知

会员服务 ·

0

【新书】自然语言处理嵌入：语义向量表示理论与进展，从Word2Vec到BERT，163页pdf

2020 年 4 月 4 日 专知

【导读】嵌入向量（ embedding）是一项广受欢迎的技术，有着众多应用。最近来自撰写了《Embeddings in Natural Language Processing Theory and Advances in Vector Representation of Meaning》，共163页pdf，该书首先解释了传统的词向量空间模型和词嵌入(如Word2Vec和GloVe)，然后介绍了其他类型的嵌入，如语意、句子和文档以及图形嵌入。我们还概述了上下文化表示(如ELMo、BERT)的最新发展状况，并解释了它们在NLP中的潜力。值得关注。

自2010年代早期以来，嵌入一直是自然语言处理(NLP)的流行词汇之一。将信息编码为低维向量表示，在现代机器学习算法中很容易得到集成，这在NLP的发展中起到了核心作用。嵌入技术最初集中在单词上，但很快注意力开始转向其他形式:从图形结构(如知识库)，转向其他类型的文本内容(如句子和文档)。

这本书提供了一个高层次NLP嵌入技术的综述。该书首先解释了传统的词向量空间模型和词嵌入(如Word2Vec和GloVe)，然后介绍了其他类型的嵌入，如语意、句子和文档以及图形嵌入。我们还概述了上下文化表示(如ELMo、BERT)的最新发展状况，并解释了它们在NLP中的潜力。

在第二章，我们提供了一些基本的NLP和机器学习应用于语言问题的背景知识。然后，简要介绍了词汇语义中常用的一些主要的知识资源。

第3章讨论了单词表示，从传统的基于可数的模型的简要概述开始，接着是最近的基于预测的和基于字符的嵌入。在同一章中，我们还描述了一些专门用于嵌入的技术，例如跨语言单词嵌入，以及单词表示的通用评估方法。

第4章讨论了嵌入结构化知识资源的各种技术，特别是语义图。我们将概述最近的主要方法对于图的嵌入，并总结其应用和评价。

在第5章中，我们重点讨论了单词的个别含义的表示，即:文字意义。讨论了两类意义表示(无监督的和基于知识的)，然后讨论了这类表示的评价技术。

第六章是关于上下文嵌入的最新分支。在本章中，我们首先解释这种嵌入的必要性，然后描述主要的模型以及它们如何与语言模型相联系。在同一章中，我们还介绍了解释和分析上下文模型有效性的一些工作。

第7章超越了单词的层次，描述了如何将句子和文档编码成向量表示。我们介绍了一些著名的监督和非监督技术，并讨论了这些表示的应用和评估方法。

第8章解释了最近讨论的词嵌入的一些伦理问题和固有偏见。本章还介绍了消除词嵌入的一些建议。

最后，在第九章中，我们提出了结束语和开放式研究的挑战。

http://josecamachocollados.com/book_embNLP_draft.pdf

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“ENLP” 就可以获取《【新书】自然语言处理嵌入：语义向量表示理论与进展，从Word2Vec到BERT，163页pdf》新书专知下载链接

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

23

相关内容

【实用书】Python文本分析第二版，688页pdf带你入门自然语言处理

【实用书】Python文本分析第二版，688页pdf带你入门自然语言处理

专知会员服务

162+阅读 · 2020年5月15日

面向结构化数据的向量嵌入理论 | word2vec, node2vec, graph2vec, X2vec: Towards a Theory of Vector Embeddings of Structured Data

面向结构化数据的向量嵌入理论 | word2vec, node2vec, graph2vec, X2vec: Towards a Theory of Vector Embeddings of Structured Data

专知会员服务

52+阅读 · 2020年4月1日

临床自然语言处理中的嵌入综述，SECNLP: A survey of embeddings

临床自然语言处理中的嵌入综述，SECNLP: A survey of embeddings

专知会员服务

38+阅读 · 2020年3月23日

【牛津DeepMind】从Word2Vec到BERT:上下文嵌入(Contextual Embeddings)综述论文

【牛津DeepMind】从Word2Vec到BERT:上下文嵌入(Contextual Embeddings)综述论文

专知会员服务

85+阅读 · 2020年3月18日

【牛津大学-DeepMind 】上下文嵌入综述，A Survey on Contextual Embeddings

【牛津大学-DeepMind 】上下文嵌入综述，A Survey on Contextual Embeddings

专知会员服务

42+阅读 · 2020年3月17日

史上最全《知识图谱》2020综述论文，130页pdf，547篇参考文献

史上最全《知识图谱》2020综述论文，130页pdf，547篇参考文献

专知会员服务

461+阅读 · 2020年3月7日

深度学习自然语言处理进展综述论文

专知会员服务

201+阅读 · 2020年3月6日

【AAAI2020-Tutorial-Penn】迁移表示学习最新进展，Recent Advances in Transferable Representation Learning

【AAAI2020-Tutorial-Penn】迁移表示学习最新进展，Recent Advances in Transferable Representation Learning

专知会员服务

52+阅读 · 2020年2月8日

清华大学朱文武老师最新「图表示深度学习」的5种方法综述论文，51页pdf

清华大学朱文武老师最新「图表示深度学习」的5种方法综述论文，51页pdf

专知会员服务

269+阅读 · 2020年1月4日

【博士论文】自然语言处理的神经图嵌入方法，Neural Graph Embedding methods for Natural Language Processing

【博士论文】自然语言处理的神经图嵌入方法，Neural Graph Embedding methods for Natural Language Processing

专知会员服务

80+阅读 · 2019年11月5日

图嵌入（Graph embedding）综述

图嵌入（Graph embedding）综述

人工智能前沿讲习班

449+阅读 · 2019年4月30日

自编码表示学习 25页最新进展综述，90篇参考文献

自编码表示学习 25页最新进展综述，90篇参考文献

专知

34+阅读 · 2018年12月18日

自然语言处理中的深度迁移学习——文本预训练

自然语言处理中的深度迁移学习——文本预训练

专知

16+阅读 · 2018年12月10日

基于深度学习的NLP 32页最新进展综述，190篇参考文献

基于深度学习的NLP 32页最新进展综述，190篇参考文献

人工智能学家

28+阅读 · 2018年12月4日

一文了解自然语言处理神经史

一文了解自然语言处理神经史

云栖社区

11+阅读 · 2018年12月2日

自然语言处理(NLP)前沿进展报告

自然语言处理(NLP)前沿进展报告

人工智能学家

20+阅读 · 2018年9月30日

深度 | 自然语言处理的一大步，应用Word2Vec模型学习单词向量表征

深度 | 自然语言处理的一大步，应用Word2Vec模型学习单词向量表征

机器之心

8+阅读 · 2018年8月1日

2017深度学习NLP进展与趋势

2017深度学习NLP进展与趋势

云栖社区

7+阅读 · 2017年12月17日

学界 | 词嵌入2017年进展全面梳理：趋势和未来方向

学界 | 词嵌入2017年进展全面梳理：趋势和未来方向

机器之心

4+阅读 · 2017年10月24日

字词的向量表示

字词的向量表示

黑龙江大学自然语言处理实验室

4+阅读 · 2016年6月13日

Pre-trained Models for Natural Language Processing: A Survey

Arxiv

113+阅读 · 2020年3月18日

A Survey on Contextual Embeddings

Arxiv

29+阅读 · 2020年3月16日

Deep Universal Graph Embedding Neural Network

Arxiv

6+阅读 · 2019年9月25日

K-BERT: Enabling Language Representation with Knowledge Graph

K-BERT: Enabling Language Representation with Knowledge Graph

Arxiv

19+阅读 · 2019年9月17日

KG-BERT: BERT for Knowledge Graph Completion

Arxiv

15+阅读 · 2019年9月11日

Language Modeling with Deep Transformers

Arxiv

6+阅读 · 2019年7月11日

A Unified Model for Joint Chinese Word Segmentation and Dependency Parsing

Arxiv

4+阅读 · 2019年4月9日

A Probe into Understanding GAN and VAE models

A Probe into Understanding GAN and VAE models

Arxiv

9+阅读 · 2018年12月13日

Universal Language Model Fine-tuning for Text Classification

Arxiv

3+阅读 · 2018年5月23日

One-shot and few-shot learning of word embeddings

Arxiv

5+阅读 · 2017年10月27日

VIP会员

相关主题

词向量表示

向量空间模型

自然语言处理

相关VIP内容

【实用书】Python文本分析第二版，688页pdf带你入门自然语言处理

【实用书】Python文本分析第二版，688页pdf带你入门自然语言处理

专知会员服务

162+阅读 · 2020年5月15日

面向结构化数据的向量嵌入理论 | word2vec, node2vec, graph2vec, X2vec: Towards a Theory of Vector Embeddings of Structured Data

面向结构化数据的向量嵌入理论 | word2vec, node2vec, graph2vec, X2vec: Towards a Theory of Vector Embeddings of Structured Data

专知会员服务

52+阅读 · 2020年4月1日

临床自然语言处理中的嵌入综述，SECNLP: A survey of embeddings

临床自然语言处理中的嵌入综述，SECNLP: A survey of embeddings

专知会员服务

38+阅读 · 2020年3月23日

【牛津DeepMind】从Word2Vec到BERT:上下文嵌入(Contextual Embeddings)综述论文

【牛津DeepMind】从Word2Vec到BERT:上下文嵌入(Contextual Embeddings)综述论文

专知会员服务

85+阅读 · 2020年3月18日

【牛津大学-DeepMind 】上下文嵌入综述，A Survey on Contextual Embeddings

【牛津大学-DeepMind 】上下文嵌入综述，A Survey on Contextual Embeddings

专知会员服务

42+阅读 · 2020年3月17日

史上最全《知识图谱》2020综述论文，130页pdf，547篇参考文献

史上最全《知识图谱》2020综述论文，130页pdf，547篇参考文献

专知会员服务

461+阅读 · 2020年3月7日

深度学习自然语言处理进展综述论文

专知会员服务

201+阅读 · 2020年3月6日

【AAAI2020-Tutorial-Penn】迁移表示学习最新进展，Recent Advances in Transferable Representation Learning

【AAAI2020-Tutorial-Penn】迁移表示学习最新进展，Recent Advances in Transferable Representation Learning

专知会员服务

52+阅读 · 2020年2月8日

清华大学朱文武老师最新「图表示深度学习」的5种方法综述论文，51页pdf

清华大学朱文武老师最新「图表示深度学习」的5种方法综述论文，51页pdf

专知会员服务

269+阅读 · 2020年1月4日

【博士论文】自然语言处理的神经图嵌入方法，Neural Graph Embedding methods for Natural Language Processing

【博士论文】自然语言处理的神经图嵌入方法，Neural Graph Embedding methods for Natural Language Processing

专知会员服务

80+阅读 · 2019年11月5日

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关资讯

图嵌入（Graph embedding）综述

图嵌入（Graph embedding）综述

人工智能前沿讲习班

449+阅读 · 2019年4月30日

自编码表示学习 25页最新进展综述，90篇参考文献

自编码表示学习 25页最新进展综述，90篇参考文献

专知

34+阅读 · 2018年12月18日

自然语言处理中的深度迁移学习——文本预训练

自然语言处理中的深度迁移学习——文本预训练

专知

16+阅读 · 2018年12月10日

基于深度学习的NLP 32页最新进展综述，190篇参考文献

基于深度学习的NLP 32页最新进展综述，190篇参考文献

人工智能学家

28+阅读 · 2018年12月4日

一文了解自然语言处理神经史

一文了解自然语言处理神经史

云栖社区

11+阅读 · 2018年12月2日

自然语言处理(NLP)前沿进展报告

自然语言处理(NLP)前沿进展报告

人工智能学家

20+阅读 · 2018年9月30日

深度 | 自然语言处理的一大步，应用Word2Vec模型学习单词向量表征

深度 | 自然语言处理的一大步，应用Word2Vec模型学习单词向量表征

机器之心

8+阅读 · 2018年8月1日

2017深度学习NLP进展与趋势

2017深度学习NLP进展与趋势

云栖社区

7+阅读 · 2017年12月17日

学界 | 词嵌入2017年进展全面梳理：趋势和未来方向

学界 | 词嵌入2017年进展全面梳理：趋势和未来方向

机器之心

4+阅读 · 2017年10月24日

字词的向量表示

字词的向量表示

黑龙江大学自然语言处理实验室

4+阅读 · 2016年6月13日

相关论文

Pre-trained Models for Natural Language Processing: A Survey

Arxiv

113+阅读 · 2020年3月18日

A Survey on Contextual Embeddings

Arxiv

29+阅读 · 2020年3月16日

Deep Universal Graph Embedding Neural Network

Arxiv

6+阅读 · 2019年9月25日

K-BERT: Enabling Language Representation with Knowledge Graph

K-BERT: Enabling Language Representation with Knowledge Graph

Arxiv

19+阅读 · 2019年9月17日

KG-BERT: BERT for Knowledge Graph Completion

Arxiv

15+阅读 · 2019年9月11日

Language Modeling with Deep Transformers

Arxiv

6+阅读 · 2019年7月11日

A Unified Model for Joint Chinese Word Segmentation and Dependency Parsing

Arxiv

4+阅读 · 2019年4月9日

A Probe into Understanding GAN and VAE models

A Probe into Understanding GAN and VAE models

Arxiv

9+阅读 · 2018年12月13日

Universal Language Model Fine-tuning for Text Classification

Arxiv

3+阅读 · 2018年5月23日

One-shot and few-shot learning of word embeddings

Arxiv

5+阅读 · 2017年10月27日

大家都在搜

软件无线电

CMU博士论文

无人机集群

国防科技创新

论文浅尝 - ICLR2020 | 通过神经逻辑归纳学习有效地解释

微信扫码咨询专知VIP会员