李飞飞团队最新论文：提出新网络，学习新策略，让AI通过视觉观察实现因果归纳

会员服务 ·

李飞飞团队最新论文：提出新网络，学习新策略，让AI通过视觉观察实现因果归纳

2019 年 10 月 10 日 量子位

鱼羊发自凹非寺
量子位报道 | 公众号 QbitAI

所谓因果，作为一个人类，你肯定并不陌生。

银杏叶黄了，是因为寒露已至。你的肚子开始咕咕叫，是因为晚饭时间到了。

因果推理这个词看上去并不日常，但事实上，这是人类在与现实世界进行交互时必不可少的能力。

对于AI来说，因果推理能力同样很重要。随着深度学习模型在各个领域取得巨大成功，其缺失因果推理能力的问题也逐渐暴露。没有正确的因果模型，这些机器学习方法的泛化就很成问题，比如，给图像生成说明的模型有时候会生成一些脱离实际的说明文字。

如此AI，显得很不智能。

图灵奖得主Judea Pearl就曾指出，机器学习的突破口在于“因果革命”。

现在，李飞飞团队带来了他们在因果推理方面的最新研究：

让人工智能在视觉观察中逐步生成因果图，并有选择性地根据诱导图来决定行动。

所以，他们是怎么样赋予AI因果推理的能力的呢？

两个阶段

对于AI而言，因果归纳和推理是两个不同的阶段。

比如说，进入一个有许多灯的陌生房间，在不事先了解布线的情况下，想要开灯，就得先试试各个开关，理清开关和灯之间的对应关系。

AI触发开关的第一阶段，就是因果归纳。在这一阶段，智能体通过执行动作并观察结果，来发现潜在的因果关系。

第二阶段是因果推理，智能体使用已获得的因果关系来决定行动，以完成任务。

为了建立有效的因果归纳和推理计算模型，必须在测试时完成对新的因果关系和新任务目标的概括。

第一阶段，李飞飞团队采用因果归纳模型，根据智能体的观察数据构建因果结构，即随机变量的有向无环图。

这里采用的新技术，是迭代因果归纳网络。

迭代因果归纳网络

从原始的感官观察中归纳出因果结构，需要准确地捕捉每个行为对环境的独特影响，同时考虑其他行为的混杂影响。

研究团队假设，最能概括因果关系的归纳网络将是一个能分解单个动作及其对应效果的网络，并且只更新因果图的相关成分。

在迭代模型中，首先假设因果结构的边缘权重为0（即没有因果关系），并将观测数据的每个帧映射到一个编码。

然后，计算跨时间步长的状态嵌入之间的差异（即，状态残差），并将其与相应的动作关联起来。

这些数据被喂给边缘解码器模块（the Edge Decoder），该模块负责预测边缘更新，以及用于衡量边缘更新如何应用于节点的注意力向量。

最后，应用基于当前图的更多边缘更新，并输出最终的预测图。

第二阶段，使用因果结构将目标条件策略置于背景之中，以执行指定目标的任务。因果结构的构造是显式的，这样，在long-horizon任务中，新的问题实例能更好地泛化。

研究团队提出了基于注意力的图编码的目标条件策略（goal-conditioned policy）。

学习目标条件策略

这一策略的目的是给定一个初始图像，一个目标图像，以及预测的因果结果，在规定时间步长内完成既定目标。

输入数据是当前图像，目标图像和预测因果图。假设最佳策略专注于学习因果图中与当前任务步骤相关的边缘。

将当前图像和目标图像进行编码。基于这一编码，输出因果图中“效果”上的注意力向量，从而提取相关边缘。然后，将其与图像编码对应起来，预测最终动作。

实验

新方法效果如何，还是要用实验说话。

迭代因果归纳网络（ICIN）的比较对象，是使用时间卷积的非迭代归纳模型（TCIN）和不带注意力机制的ICIN。

在绝大部分实验条件之下，李飞飞团队的方法（蓝条）都要优于对照组。

One More Thing

学会因果推理的AI，有什么用呢？

李飞飞团队曾经造出这样一只AI，能“窥见未来”。

一个人从车后绕来，他是谁？要去哪儿？想干什么？

这只AI不仅“预知”了线路，还答出了“开门”这个正确答案。

对于人类而言，做出这样的预测并不难，以特定目的为导向，了解一个人的目的，就能推测他要去哪儿要做什么。

同样，对于AI而言，学会了因果推理，在完成目标导向任务时，就能事半功倍。

李飞飞团队

论文一作，是斯坦福在读博士Suraj Nair，曾在谷歌大脑实习。

他师从Silvio Savarese教授，也就是李飞飞的丈夫。

论文的另一位作者是Yuke Zhu是斯坦福SVL实验室（Stanford Vision and Learning Lab）的一员，该实验室由李飞飞，Silvio Savarese和Juan Carlos Niebles主导。

Yuke Zhu今年8月刚从斯坦福博士毕业，将于2020年秋季入职德州大学奥斯汀分校。

李飞飞和她的丈夫Silvio Savarese为论文的另外两名作者。

论文地址：

https://arxiv.org/abs/1910.01751

作者系网易新闻·网易号“各有态度”签约作者

— 完 —

大会启幕！预见智能科技新未来

量子位MEET 2020智能未来大会启幕，将携手优秀AI企业、杰出科研人员呈现一场高质量行业盛会！详情可点击图片：

榜单征集！三大奖项，锁定AI Top玩家

2019中国人工智能年度评选启幕，将评选领航企业、商业突破人物、最具创新力产品3大奖项，并于MEET 2020大会揭榜，欢迎优秀的AI公司扫码报名！

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧 !

登录查看更多

相关内容

因果推理

关注 395

因果推断是研究如何更加科学地识别变量间的因果关系。客观事物普遍存在着内在的因果联系，人们只有弄清事物发展变化的前因后果，才能全面地、本质地认识事物。基干事物发展的这种规律，在论证观点时，有时就可以直接从事物本身的因果关系中进行推论，这就叫因果推断法

最新《贝叶斯深度学习》综述论文，35页pdf，A Survey on Bayesian Deep Learning

专知会员服务

209+阅读 · 2020年7月5日

生成式对抗网络(GANs)最新2020综述，41页pdf阐述GAN训练、挑战、解决方案和未来方向

专知会员服务

197+阅读 · 2020年5月14日

因果关联学习，Causal Relational Learning

专知会员服务

185+阅读 · 2020年4月21日

【WWW2020-人大】通过对抗性学习从用户-项目交互数据中挖掘隐含的实体偏好以完成知识图谱补全

专知会员服务

48+阅读 · 2020年4月1日

【ACL2019】基于学习注意力机制的知识图谱中关系预测的嵌入 Learning Attention-based Embeddings for Relation Prediction in Knowledge Graphs

专知会员服务

122+阅读 · 2020年3月29日

[CVPR2020-Oral-FAIR-UIUC]使用原力，卢克!学习通过模拟效应来预测物理力

专知会员服务

10+阅读 · 2020年3月27日

【强化学习最新综述】详解强化学习当前进展及未来方向

专知会员服务

239+阅读 · 2020年1月23日

【基于元学习的推荐系统】5篇相关论文

专知会员服务

88+阅读 · 2020年1月20日

【XAI研讨会】知识图谱中的可解释可验证表示学习，62页ppt

专知会员服务

134+阅读 · 2019年12月7日

【图灵奖Yoshua Bengio】ICLR2020论文：一个元转移的目标学习解开因果机制（A Meta-Transfer Objective for Learning to Disentangle Causal Mechanisms）

专知会员服务

55+阅读 · 2019年9月26日

【论文笔记】基于门控图网络实现图到序列学习

专知

56+阅读 · 2019年10月5日

大脑通过统计推理表征“自我”

人工智能学家

6+阅读 · 2019年9月4日

用深度学习揭示数据的因果关系

专知

28+阅读 · 2019年5月18日

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

机器之心

17+阅读 · 2019年2月11日

【因果关系】由模仿“人脑”转向“因果推理”

产业智能官

10+阅读 · 2018年7月13日

李飞飞团队CVPR论文：让AI识别语义空间关系（附论文、实现代码）

数据派THU

3+阅读 · 2018年6月30日

一文详解LSTM网络

论智

18+阅读 · 2018年5月2日

论文笔记之attention mechanism专题1:SA-Net（CVPR 2018）

统计学习与视觉计算组

16+阅读 · 2018年4月5日

一文读懂因果推测、倾向模型（结合实例）

数据派THU

3+阅读 · 2018年3月26日

[论文笔记] GAN开山之作及最新综述

专知

13+阅读 · 2017年12月19日

Few-Shot Knowledge Graph Completion

Arxiv

15+阅读 · 2019年11月26日

Learning Disentangled Representations for Recommendation

Arxiv

8+阅读 · 2019年10月31日

Compositional Generalization in Image Captioning

Arxiv

3+阅读 · 2019年9月16日

Learning Attention-based Embeddings for Relation Prediction in Knowledge Graphs

Arxiv

40+阅读 · 2019年6月4日

Learning Discriminative Model Prediction for Tracking

Arxiv

6+阅读 · 2019年4月15日

Factor Graph Attention

Arxiv

6+阅读 · 2019年4月11日

Progressive Pose Attention Transfer for Person Image Generation

Arxiv

5+阅读 · 2019年4月9日

Learning Conditioned Graph Structures for Interpretable Visual Question Answering

Arxiv

4+阅读 · 2018年6月20日

Zero-shot Recognition via Semantic Embeddings and Knowledge Graphs

Arxiv

6+阅读 · 2018年3月21日

Discrete Autoencoders for Sequence Models

Arxiv

6+阅读 · 2018年1月29日

VIP会员

李飞飞团队最新论文：提出新网络，学习新策略，让AI通过视觉观察实现因果归纳

鱼羊 发自 凹非寺量子位 报道 | 公众号 QbitAI

两个阶段

迭代因果归纳网络

学习目标条件策略

实验

One More Thing

李飞飞团队

相关内容

鱼羊发自凹非寺
量子位报道 | 公众号 QbitAI