推荐｜CS224n研究热点：自动组合神经网络做问答系统！

2017 年 9 月 27 日 全球人工智能

“全球人工智能”拥有十多万AI产业用户，10000多名AI技术专家。主要来自：北大，清华，中科院，麻省理工，卡内基梅隆，斯坦福，哈佛，牛津，剑桥...以及谷歌，腾讯，百度，脸谱，微软，阿里，海康威视，英伟达......等全球名校和名企。

这是自我组装推断的QA，可接受多种知识，包括图片和结构化知识库。问答具有复合性，很早就有人引入句法分析判断究竟在问什么，甚至脑洞大开想做自然语言编译器。但他们总是脱离不了手写规则的思维，白白糟蹋了性能卓越的句法分析器。而该模型自动组装多个神经网络用于逻辑推断，拿到了显著的好成绩。

四个 Jointly 训练的组件

hankcs.com 2017-07-13 下午4.34.11.png

利用这四个组件可以组装分析问题的逻辑流：

hankcs.com 2017-07-13 下午4.36.09.png

目标是训练模型自动分析query，组装逻辑组件。

模型：在两个分布上构建

hankcs.com 2017-07-13 下午4.40.44.png

一个Layout Model，选择问题的layout（应该是逻辑语句的“语法树”）。一个Execution Model，在world representation（应该理解为fact的表示）上执行layout。

Layout Model

这个模型的训练有3步，首先将输入句子解析为依存句法树：

hankcs.com 2017-07-13 下午4.42.18.png

第二步，将句法树的片段分配给合适的逻辑组件：

hankcs.com 2017-07-13 下午4.43.57.png

最后，将逻辑片段组装为完整的layout：

hankcs.com 2017-07-13 下午4.45.11.png

这个layout的root是and逻辑，每个句子可能有多个layout，接下来介绍如何为layout打分

Layout Scoring Model

得到问题的LSTM表示，以及特征表示，将两个表示传入多层感知机。每个时刻的梯度是layout的log-probability乘以该layout预测的准确率的梯度。

Execution Model

在知识库上面执行逻辑查询，输入结构化知识库中某种实体的所有representation，流入逻辑树输出每个备选答案的分值，取最大的那个。

hankcs.com 2017-07-13 下午4.55.03.png

Module: lookup

就是lookup table，去结构化知识库（数据库）取数据，查出实体的向量表示：

hankcs.com 2017-07-13 下午5.50.17.png

“把全部attention放到第

Module: find

也是把输入的特征拼接起来往多层感知机里面过一下然后softmax。这里的输入应当是遍历所有单词。

Module: and

有点像集合运算中的交集，只不过是在多个attention上做的乘法：

训练Execution Model

目标函数是给定world representation和layout下正确答案的最大似然：

结果

VQA

直观效果不错：

也拿到了最高分数：

GeoQA

在这个领域知识库上表现也很出色：

虽然在结构化知识库的手写特征利用上没有免俗，但总算自动化了“推断”这个被丑陋规则统治的部分。

AI专家问答平台

热门文章推荐

厉害｜黄仁勋狂怼CPU:摩尔定律已死未来属于GPU!

干货｜7步让你从零开始掌握Python机器学习！

华裔女科学家钱璐璐，发明仅20纳米的DNA机器人！

Geoffrey Hinton提出capsule 概念，推翻反向传播！

2017年7大最受欢迎的AI编程语言：Python第一!

重磅｜中国首家人工智能技术学院在京揭牌开学！

厉害 | 南京大学周志华教授当选欧洲科学院外籍院士！

5个月市值涨了1200亿，首次突破3100亿市值！

华为扔下这枚“AI芯弹”，全世界的智能手机都卡（慢）死了！

用57行代码搞定花8000万美元采购车牌识别项目

相关内容

CS224N

关注 2

【斯坦福CS520】向量空间中嵌入的知识图谱推理，48页ppt

专知会员服务

104+阅读 · 2020年6月11日

斯坦福大学经典《自然语言处理cs224n》2020课件合集

专知会员服务

97+阅读 · 2020年5月25日

深度学习自然语言处理概述，216页ppt，Jindřich Helcl

专知会员服务

216+阅读 · 2020年4月26日

CMU-卡内基梅隆大学2020《神经网络自然语言处理》课程课件全集，不可错过！

专知会员服务

68+阅读 · 2020年3月20日

WSDM 2020教程《深度贝叶斯数据挖掘》，附257页PPT下载

专知会员服务

157+阅读 · 2020年2月7日

【斯坦福 Chris Manning 新课】CS224n：自然语言处理与深度学习，附课程PPT下载

专知会员服务

75+阅读 · 2020年1月7日

【论文强烈推荐】基于卷积神经网络的基因组序列基序的表示学习，Representation learning of genomic sequence motifs with convolutional neural networks

专知会员服务

12+阅读 · 2019年12月21日

【论文推荐】基于BERT修剪的问答模型（Pruning a BERT-based Question Answering Model）

专知会员服务

30+阅读 · 2019年11月22日

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

专知会员服务

63+阅读 · 2019年10月27日

【文献综述】视频多目标跟踪中的深度学习方法，38页pdf

专知会员服务

53+阅读 · 2019年8月1日

基于知识蒸馏的BERT模型压缩

大数据文摘

18+阅读 · 2019年10月14日

博客 | 斯坦福大学—自然语言处理中的深度学习（CS 224D notes-1）

AI研习社

5+阅读 · 2018年11月19日

最强NLP模型BERT喜迎PyTorch版！谷歌官方推荐，也会支持中文

量子位

13+阅读 · 2018年11月7日

深度解析LSTM神经网络的设计原理

数盟

4+阅读 · 2018年6月22日

论文浅尝 | 利用知识图谱增强神经网络来解决自然语言处理的任务

开放知识图谱

6+阅读 · 2018年4月27日

论文浅尝 | 基于神经网络的推理（DeepMind Relational Reasoning）

开放知识图谱

14+阅读 · 2018年4月3日

论文解读 | 基于神经网络的知识推理

PaperWeekly

5+阅读 · 2018年3月8日

推荐｜斯坦福大学面向Tensorflow深度学习研究课程(2018)

全球人工智能

4+阅读 · 2018年1月14日

基于神经网络的高性能依存句法分析器

全球人工智能

8+阅读 · 2017年10月3日

推荐｜斯坦福大学机器学习：神经网络的表示！

全球人工智能

5+阅读 · 2017年9月20日

Hierarchical Meta Learning

Arxiv

9+阅读 · 2019年4月19日

BAG: Bi-directional Attention Entity Graph Convolutional Network for Multi-hop Reasoning Question Answering

Arxiv

4+阅读 · 2019年4月10日

End-to-End Learning for Answering Structured Queries Directly over Text

Arxiv

3+阅读 · 2018年11月16日

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

Arxiv

15+阅读 · 2018年10月11日

Hypernetwork Knowledge Graph Embeddings

Arxiv

7+阅读 · 2018年8月28日

Relational recurrent neural networks

Arxiv

8+阅读 · 2018年6月28日

Self-Consistent Trajectory Autoencoder: Hierarchical Reinforcement Learning with Trajectory Embeddings

Arxiv

6+阅读 · 2018年6月7日

Multi-Label Zero-Shot Learning with Structured Knowledge Graphs

Arxiv

7+阅读 · 2018年5月26日

Chinese NER Using Lattice LSTM

Arxiv

14+阅读 · 2018年5月15日

A Bayesian Model for Activities Recommendation and Event Structure Optimization Using Visitors Tracking

Arxiv

4+阅读 · 2018年2月28日

VIP会员