Mikolov et al. (2013a) observed that continuous bag-of-words (CBOW) word embeddings tend to underperform Skip-gram (SG) embeddings, and this finding has been reported in subsequent works. We find that these observations are driven not by fundamental differences in their training objectives, but more likely on faulty negative sampling CBOW implementations in popular libraries such as the official implementation, word2vec.c, and Gensim. We show that after correcting a bug in the CBOW gradient update, one can learn CBOW word embeddings that are fully competitive with SG on various intrinsic and extrinsic tasks, while being many times faster to train.


翻译:Mikolov等人(2013年a)观察到,连续一袋字嵌入(CBOW)的字嵌入往往表现不佳,而这一发现在随后的著作中已经得到报告,我们发现,这些观察并不是由于培训目标存在根本差异,而是由于在诸如正式实施、Word2vec.c和Gensim等流行图书馆中执行CBOW(CBOW)的错误抽样调查中出现错误差错。我们显示,在纠正CBOW梯度更新中的错误之后,人们可以学习CBOW的字嵌入,这些词嵌入与SG在各种内在和外部任务上具有充分竞争力,同时培训速度要快许多倍。

0
下载
关闭预览

相关内容

连续词袋模型(CBOW),利用上下文或周围的单词来预测中心词。其输入为某一个特征词的上下文相关对应的词向量(单词的one-hot编码);输出为这特定的一个词的词向量(单词的one-hot编码)。
最新《Transformers模型》教程,64页ppt
专知会员服务
309+阅读 · 2020年11月26日
一份简单《图神经网络》教程,28页ppt
专知会员服务
124+阅读 · 2020年8月2日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
78+阅读 · 2020年7月26日
《DeepGCNs: Making GCNs Go as Deep as CNNs》
专知会员服务
30+阅读 · 2019年10月17日
强化学习最新教程,17页pdf
专知会员服务
176+阅读 · 2019年10月11日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
40+阅读 · 2019年10月9日
【论文笔记】通俗理解少样本文本分类 (Few-Shot Text Classification) (1)
深度学习自然语言处理
7+阅读 · 2020年4月8日
词向量与ELMo模型
AINLP
6+阅读 · 2020年3月16日
分布式并行架构Ray介绍
CreateAMind
9+阅读 · 2019年8月9日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
LibRec 每周算法:LDA主题模型
LibRec智能推荐
29+阅读 · 2017年12月4日
【推荐】SVM实例教程
机器学习研究会
17+阅读 · 2017年8月26日
字词的向量表示
黑龙江大学自然语言处理实验室
4+阅读 · 2016年6月13日
Simplifying Graph Convolutional Networks
Arxiv
12+阅读 · 2019年2月19日
Arxiv
3+阅读 · 2018年2月22日
Arxiv
4+阅读 · 2017年10月30日
VIP会员
相关VIP内容
最新《Transformers模型》教程,64页ppt
专知会员服务
309+阅读 · 2020年11月26日
一份简单《图神经网络》教程,28页ppt
专知会员服务
124+阅读 · 2020年8月2日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
78+阅读 · 2020年7月26日
《DeepGCNs: Making GCNs Go as Deep as CNNs》
专知会员服务
30+阅读 · 2019年10月17日
强化学习最新教程,17页pdf
专知会员服务
176+阅读 · 2019年10月11日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
40+阅读 · 2019年10月9日
相关资讯
【论文笔记】通俗理解少样本文本分类 (Few-Shot Text Classification) (1)
深度学习自然语言处理
7+阅读 · 2020年4月8日
词向量与ELMo模型
AINLP
6+阅读 · 2020年3月16日
分布式并行架构Ray介绍
CreateAMind
9+阅读 · 2019年8月9日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
LibRec 每周算法:LDA主题模型
LibRec智能推荐
29+阅读 · 2017年12月4日
【推荐】SVM实例教程
机器学习研究会
17+阅读 · 2017年8月26日
字词的向量表示
黑龙江大学自然语言处理实验室
4+阅读 · 2016年6月13日
Top
微信扫码咨询专知VIP会员