We introduce functorial language models: a principled way to compute probability distributions over word sequences given a monoidal functor from grammar to meaning. This yields a method for training categorical compositional distributional (DisCoCat) models on raw text data. We provide a proof-of-concept implementation in DisCoPy, the Python toolbox for monoidal categories.
翻译:我们引入了调试语言模型: 一种原则性的方法, 用来计算从语法到含义的单相形色谱真菌真象序列的概率分布。 这产生了一种在原始文本数据上培训绝对成份分布模型的方法。 我们在 DiscoPy, 即单相色谱类的 Python 工具箱中提供概念执行证明 。