推荐|CS224n研究热点:自动组合神经网络做问答系统!

2017 年 9 月 27 日 全球人工智能

“全球人工智能”拥有十多万AI产业用户,10000多名AI技术专家。主要来自:北大,清华,中科院,麻省理工,卡内基梅隆,斯坦福,哈佛,牛津,剑桥...以及谷歌,腾讯,百度,脸谱,微软,阿里,海康威视,英伟达......等全球名校和名企。


-免费加入AI高管投资群>>

-免费加入AI技术专家群>>

这是自我组装推断的QA,可接受多种知识,包括图片和结构化知识库。问答具有复合性,很早就有人引入句法分析判断究竟在问什么,甚至脑洞大开想做自然语言编译器。但他们总是脱离不了手写规则的思维,白白糟蹋了性能卓越的句法分析器。而该模型自动组装多个神经网络用于逻辑推断,拿到了显著的好成绩。

四个 Jointly 训练的组件

利用这四个组件可以组装分析问题的逻辑流:

目标是训练模型自动分析query,组装逻辑组件。

模型:在两个分布上构建

一个Layout Model,选择问题的layout(应该是逻辑语句的“语法树”)。一个Execution Model,在world representation(应该理解为fact的表示)上执行layout。

Layout Model

这个模型的训练有3步,首先将输入句子解析为依存句法树:

第二步,将句法树的片段分配给合适的逻辑组件:

最后,将逻辑片段组装为完整的layout:

这个layout的root是and逻辑,每个句子可能有多个layout,接下来介绍如何为layout打分

Layout Scoring Model

得到问题的LSTM表示,以及特征表示,将两个表示传入多层感知机。每个时刻的梯度是layout的log-probability乘以该layout预测的准确率的梯度。

Execution Model

在知识库上面执行逻辑查询,输入结构化知识库中某种实体的所有representation,流入逻辑树输出每个备选答案的分值,取最大的那个。

Module: lookup

就是lookup table,去结构化知识库(数据库)取数据,查出实体的向量表示:

“把全部attention放到第