这本开放获取的书籍介绍了向量语义学,它将词向量的形式理论与语言学的认知理论相链接。开发词向量的计算语言学家和深度学习研究者主要依赖于大量语料库的日益增加和拥有高度并行GPU和TPU计算引擎的计算机,他们的关注点在于赋予计算机自然语言处理能力,以便应用于如机器翻译或问答等实际应用。认知语言学家从人类认知的视角研究自然语言,探讨语言与思维的关系,以及关于概念普遍性的问题,他们主要依赖于对语言使用的深入研究。
尽管这两个学派都在他们的名字中包含了“语言学”,但到目前为止,他们之间的交流非常有限,因为他们的历史起源、数据收集方法和概念框架相当不同。向量语义学通过提出一种形式理论来弥补这个鸿沟,该理论以线性多面体的形式表现,它既泛化了词向量也泛化了概念结构,它将每个词典定义视为一个方程,将整个词汇表视为一组相互制约所有含义的方程。