用向量或嵌入表示单词,可以进行计算推理,是自动完成自然语言任务的基础。例如,如果相似单词的单词嵌入包含相似的值,那么单词的相似度可以很容易地进行评估,而从它们的拼写来判断通常是不可能的(例如cat /猫科动物),预先确定和存储所有单词之间的相似度是非常耗时的,记忆密集且主观的。我们专注于从文本语料库和知识图谱中学习单词嵌入。一些著名的算法通过学习预测每个单词周围出现的单词,在无监督的基础上从文本中学习单词嵌入,例如word2vec和GloVe。这种词嵌入的参数可以反映词共现统计数据,但它们如何捕捉语义还不清楚。知识图谱表示模型学习实体(词、人、地点等)的表示以及它们之间的关系,通常是通过训练模型以监督的方式预测已知事实。尽管预测的准确性在稳步提高,但人们对其潜在结构却知之甚少。

对于单词嵌入和知识图谱表示的几何结构如何编码潜在语义结构的理解有限,使得提高其性能、可靠性或可解释性的原则手段不明确。为了解决这个问题:

  1. 通过word2vec和GloVe等算法学习的单词嵌入之间的特定几何关系对应于单词之间的语义关系,从理论上证明了经验观察的正确性;和

  2. 我们将语义和几何之间的这种对应关系扩展到知识图谱的实体和关系,为知识图谱表示的潜在结构提供了一个模型,该模型与单词嵌入的模型相关联。

成为VIP会员查看完整内容
40

相关内容

【博士论文】多任务学习视觉场景理解,140页pdf
专知会员服务
88+阅读 · 2022年4月5日
算法分析导论, 593页pdf
专知会员服务
144+阅读 · 2021年8月30日
专知会员服务
62+阅读 · 2021年2月4日
【干货书】计算机科学离散数学,627页pdf
专知会员服务
125+阅读 · 2020年8月31日
【新书册】贝叶斯神经网络,41页pdf
专知会员服务
174+阅读 · 2020年6月3日
【博士论文】开放环境下的度量学习研究
专知
6+阅读 · 2021年12月4日
从 one-hot 到 BERT,带你一步步理解 BERT
数说工作室
21+阅读 · 2019年6月25日
一步步理解BERT
AINLP
34+阅读 · 2019年6月19日
理解人类推理的深度学习
论智
17+阅读 · 2018年11月7日
【干货】深入理解变分自编码器
专知
21+阅读 · 2018年3月22日
基于 word2vec 和 CNN 的文本分类 :综述 & 实践
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2010年12月31日
国家自然科学基金
3+阅读 · 2009年12月31日
国家自然科学基金
4+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Arxiv
22+阅读 · 2022年2月4日
Heterogeneous Deep Graph Infomax
Arxiv
12+阅读 · 2019年11月19日
Arxiv
21+阅读 · 2019年8月21日
VIP会员
相关VIP内容
【博士论文】多任务学习视觉场景理解,140页pdf
专知会员服务
88+阅读 · 2022年4月5日
算法分析导论, 593页pdf
专知会员服务
144+阅读 · 2021年8月30日
专知会员服务
62+阅读 · 2021年2月4日
【干货书】计算机科学离散数学,627页pdf
专知会员服务
125+阅读 · 2020年8月31日
【新书册】贝叶斯神经网络,41页pdf
专知会员服务
174+阅读 · 2020年6月3日
相关资讯
【博士论文】开放环境下的度量学习研究
专知
6+阅读 · 2021年12月4日
从 one-hot 到 BERT,带你一步步理解 BERT
数说工作室
21+阅读 · 2019年6月25日
一步步理解BERT
AINLP
34+阅读 · 2019年6月19日
理解人类推理的深度学习
论智
17+阅读 · 2018年11月7日
【干货】深入理解变分自编码器
专知
21+阅读 · 2018年3月22日
基于 word2vec 和 CNN 的文本分类 :综述 & 实践
相关基金
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2010年12月31日
国家自然科学基金
3+阅读 · 2009年12月31日
国家自然科学基金
4+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员