【DeepMind重大突破】DNN具有人类行为，认知心理学破解黑箱

2017 年 6 月 29 日 深度学习世界

新智元编译

来源：deepmind.com 等

作者：DeepMind；Brian Mingus

编译：熊笑

【新智元导读】DeepMind 的最新论文称自己“首次”将认知心理学方法引入了对深度神经网络黑箱的理解研究中，并用认知心理学的方法发现了深度神经网络存有和人类儿童在学习词汇时也存在的“形状偏好”的行为。此文一出，就有学者指出，DeepMind 是在将过去的研究包装为全新的研究。

DeepMind 的最新论文称过去“首次”将认知心理学方法引入了对深度神经网络黑箱的理解研究中，并用认知心理学的方法发现了深度神经网络存有和人类儿童在学习词汇时也存在的“形状偏好”的行为。此文一出，就有学者指出，DeepMind 是在将自己的研究包装为全新的研究。

DeepMind 最新研究：将认知心理学首次引入深度神经网络研究

从识别和推理图像中的物体，到以超人的水准玩 Atari 和围棋游戏，深度神经网络已经学会完成很多了不起的任务。而随着这些任务和网络结构变得越来越复杂，神经网络学习得到的解决方案也变得越来越难以理解。

这就是著名的“黑箱”问题。这一问题已随着神经网络在现实世界中越来越多的应用而日益凸显。

在 DeepMind，我们正致力于扩展理解和解释深度神经网络的工具箱。在我们已被 ICML 接受的最新论文（Cognitive Psychology for Deep Neural Networks: A Shape Bias Case Study，地址：https://arxiv.org/pdf/1706.08606.pdf）里，我们为这一问题提出了新的方法：采用认知心理学中的方法来理解深度神经网络。

认知心理学通过测量行为来推断认知的机理，有大量文献描述这些机理，更不乏相关的实验论证。随着我们的神经网络在一些特定任务上接近人类水平，认知心理学中的一些方法和黑箱问题的关系越来越紧密。

为了展示这一点，我们的研究报告包括了一个案例研究：我们设计了一个实验，来阐明人类认知，从而帮助我们理解深度神经网络是如何完成一个图像分类任务的。

我们的研究显示，认知心理学家观察到的行为，同样出现在深度神经网络中。而且，对于网络是如何完成图像分类任务的，研究结果揭示出有用且令人惊讶的洞见。更笼统地说，案例研究的成功体现出了使用认知心理学理解深度学习系统的潜力。

用小样本词汇学习模型测量形状偏好。

在我们的案例研究中，我们思考了儿童是如何识别和标识物体的——认知发展心理学对此研究较为丰富。儿童从一个示例中猜出一个单词的意义——所以称为小样本词汇学习——进行得是如此简单，让人禁不住认为小样本学习是一个简单的过程。然而，哲学家Willard Van Orman Quine 提出的经典思想实验却展现出这是个多么复杂的问题。

一位田野语言学家去拜访一个语言完全不同的文化。该语言学家正在努力从一位热心的本地人那里学一些词语。这时一只兔子迅速地跑过。本地人说：“gavagai”，语言学家这时需要推理这个新词语的意义。语言学家面对的可能性多种多样，“gavagai”指的可能是兔子、动物、白色的东西、这只具体的兔子或是兔子的某个部位。有无数种可能的推理，人类如何能选出对的那一个？

“Gavagai”所指为何？

50年以后，对于能够进行小样本学习的深度神经网络，我们有了同样的问题。比如 Matching Network——DeepMind 开发出的一种神经网络。这一模型采用了注意力和记忆方面的最新进展，凭借一个孤立样本就取得了 ImageNet 图像分类任务中的目前最佳性能。

为了理解这是如何做到的，我们考察了发展心理学的研究成果。这些研究发现，儿童会通过采用归纳偏好来消除许多不正确的推理，找到正确的推理。这种偏好包括：

整体偏好：通过整体偏好，儿童假设一个词语指向的是一个完整物体，而非其组件（这排除了“gavagai”是兔子某个部分的想法）；

分类偏好：通过分类偏好，儿童假设一个词语指向的是一件事物的基本类别（这减小了“gavagai”是所有动物的可能性）

形状偏好，通过形状偏好，儿童假设一个名词的意义是基于一件事物的形状而颜色或材质（这减小了“gavagai”是白色物体的可能性）

我们选择衡量神经网络的形状偏好是因为针对人类的这一偏好有相当多的研究。

认知心理学中外部刺激的部分样例，用于测量我们深度网络的形状偏好。由印第安纳大学认知发展实验室的 Linda Smith 提供。

我们采用的经典的形状偏好实验过程操作如下：我们向深度神经网络展示了三个物体的图形：一个测试物体，一个与测试物体颜色相同但形状不同的物体，一个与测试物体形状相同但颜色不同的物体。之后我们通过记录测试物体和和形状相同物体而非颜色相同物体被做出同样标注的次数占比来测量形状偏好。

我们使用的图形是印第安纳大学认知发展实验室用于人类实验时使用的图形。

Matching network 认知心理学实验的示意图。Matching network 将测试用物体（左图）与形状相同物体A(上图，中)与颜色相同物体B（上图，右）进行匹配。输出结果（右下）取决于 Matching network 形状偏好的强度。

我们用我们的深度网络（Matching Network 及生成基准模型）来尝试这一实验，并且发现我们的网络如同人类一样对物体的形状有更强的偏好（相比较对物体的颜色或质地而言）。换言之，它们也具备形状偏好。

这说明 Matching Network 及生成分类模型采用了基于形状的推导偏好来剔除错误的假设，向我们清晰地展示了它们是如何掌握小样本词汇学习的。

对于形状偏好的观察结果并不是唯一有趣的发现：我们还观察到，形状偏好在网络训练之初是逐步显现的。这不禁令人联想到人类形状偏好的发展过程：心理学家们发现年龄偏大的儿童的形状偏好高于年龄偏小的儿童，而成人展现出的形状偏好最高。

我们还发现基于初始化和训练时随机采用的样本的不同，网络展现出的偏好水平也有所差异。因此我们认识到，在深度学习系统的实验中，必须通过大量的训练模型样本来得出可靠的实验结果，就如同心理学家不能够仅通过一个实验对象得出结论一样。

此外，我们注意到，即便各自的形状偏好非常不同，不同的网络也展现出同等的小样本学习的能力，显示出不同的网络在解决复杂问题时能够各自找出同等有效的方法。

这一神经网络结构中此前未被辨识的偏好的发现证明了使用人工认知心理学来解读神经网络解决问题过程的可能性。其他一些领域中，情景记忆的理论可被用来理解情景记忆结构，而语义认知的技术可被用于理解最近出现的概念形成模型。这些及其他一些领域内的心理学相关研究成果非常丰富，成为我们解决“黑箱”问题及深入理解神经网络行为的新工具。

论文摘要

深度神经网络（DNN）在一系列广泛的复杂任务上取得了进展，对于深度神经网络给出的解决方案，我们已经无法理解其本质。虽然这方面的研究一直在进行，但还没有人利用认知心理学家发明的一系列研究人类认知的实验方法。为了探索将认知心理学方法应用于此问题的潜在价值，我们从发展心理学中选取了一种较为成熟的分析方法，将其应用于对深度神经网络的研究中。这种分析方法解释了儿童是如何学习物体的词语名称的。凭借使用受认知心理学实验启发的刺激的数据集，我们发现，在 ImageNet 上训练的最先进的小样本学习模型，展示出了和人类一样的偏好：它们倾向于根据形状对物体分类，而非颜色。这种形状偏好在架构相同但种子不同的模型中有很大差异，甚至在训练过程中随种子不同而波动，不过分类性能几乎相当。研究结果体现了认知心理学工具在揭示 DNN 隐藏计算过程方面的能力，同时也给我们提供了一个人类词汇学习的计算模型。

抨击：DeepMind 把自己的研究包装成了全新的

DeepMind 的论文介绍博客刚发了几个小时，就有科罗拉多大学的学者Brian Mingus 指出，DeepMind 是把自己的研究包装成了全新的。

虽然大多数现代深度学习研究者对模型阐释的研究没有从认知心理学中借鉴，但如果说“从没有人做过”，则也是不对的。

自从上世纪 80 年代 Parallel Distributed Processing（https://stanford.edu/~jlmcc/）教材问世，认知心理学家一直在使用深度神经网络作为大脑模型；当然，有人会坚持认为如果反过来，将大脑看作是你模型的模型，则是全新的研究。然而最终，这种坚持没什么意义，因为这两种理念基本上是相等的：当你研究得足够深入，把人类大脑概念化，看作是一个深度神经网络，那么当你研究深度神经网络时，不把人类认知投射上去，是不太可能的。

所以，到底是怎么回事？在 Science 杂志上发表的一篇名为The Last Inventorof the Telephone （http://science.sciencemag.org/content/319/5871/1759.2）的论文里，LSTM和神经网络开创者之一的Jürgen Schmidhuber（他可能是诸位“之父”中名声最不显的一个）谈到了“学术抄底”的现象，认为科学界和工程界都有此类现象：当新研究者发现别人已经做过的研究，新研究者有机会把它包装成是自己全新的研究。这当然可以使新研究者名利双收，但互联网的存在则有助于我们打破这一陋习，把功劳归功于原始研究者。在认知心理学的历史中，我们会发现丰富的理论基础，不仅是把人类理解为深度学习模型的，也包括把深度学习模型当作人类去理解。

对于在这一领域有兴趣深入研究的人员，我推荐阅读网上的教材 Computational Cognitive Neuroscience （https://grey.colorado.edu/CompCogNeuro/index.php/CCNBook/Main）。这一科罗拉多大学 CCN Lab 的书目包括上万份覆盖了整个认知心理学、神经科学等领域历史的文献，也包括聚焦于理解用于理解我们自身的深度神经网络的知识(请注意不要混淆Computational Cognitive Neuroscience和Cognitive Computational Neuroscience，后者是一个即将到来的新的会议)

最后，如果想了解深度学习更为“纯净”的历史，我推荐你阅读这篇精彩的综述（http://www.sciencedirect.com/science/article/pii/S0893608014002135）。如果你对“模仿”你自己大脑的深度学习模型感兴趣，而且希望使用深度学习模型来塑造你对大脑的理解，或者使用认知心理学理解你的深度学习模型，试试这个明确为这一目标设计的深度学习模拟器：emergent （https://grey.colorado.edu/emergent）。

DeepMind 论文地址：https://arxiv.org/pdf/1706.08606.pdf

编译来源：https://deepmind.com/blog/cognitive-psychology/

https://www.linkedin.com/pulse/cognitive-psychology-deep-neural-networks-brian-mingus

  
    
   
     

  
    
  
    
   
     点击下方“阅读原文”了解大数据实验平台
  
    
  
    
   
     ↓↓↓

登录查看更多

相关内容

深度神经网络

关注 34

深度神经网络（DNN）是深度学习的一种框架，它是一种具备至少一个隐层的神经网络。与浅层神经网络类似，深度神经网络也能够为复杂非线性系统提供建模，但多出的层次为模型提供了更高的抽象层次，因而提高了模型的能力。

【PNAS2020-斯坦福】自监督训练的人工神经网络中的涌现语言结构

专知会员服务

20+阅读 · 2020年6月5日

多智能体深度强化学习的若干关键科学问题

专知会员服务

193+阅读 · 2020年5月24日

如何持续深度学习？看这份《DNN2GP: 从深度神经网络到高斯过程》45页ppt和论文提供新思路

专知会员服务

57+阅读 · 2020年5月15日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知会员服务

159+阅读 · 2020年5月2日

基于深度神经网络的少样本学习综述

专知会员服务

173+阅读 · 2020年4月22日

【WWW2020-微软】理解用户行为用于文档推荐

专知会员服务

36+阅读 · 2020年4月5日

物理学突破深度学习理论瓶颈？ Google-斯坦福发布《深度学习统计力学》综述论文，30页pdf阐述深度学习成功机制

专知会员服务

108+阅读 · 2020年3月26日

【WWW2020】什么是正常的，什么是奇怪的，知识图谱中缺少什么：通过归纳总结的统一表征

专知会员服务

25+阅读 · 2020年3月24日

【纽约大学】贝叶斯深度学习和泛化性的概率观点，附27页PDF下载

专知会员服务

84+阅读 · 2020年2月25日

【论文推荐】可解释神经网络，Towards Explainable Deep Neural Networks (xDNN)

专知会员服务

40+阅读 · 2019年12月5日

观点 | 深度学习+符号表征=强大的多任务通用表征，DeepMind新论文可能开启AI新时代

AI研习社

5+阅读 · 2019年6月6日

DeepMind综述深度强化学习中的快与慢，智能体应该像人一样学习

机器之心

20+阅读 · 2019年5月3日

使用强化学习训练机械臂完成人类任务

AI研习社

13+阅读 · 2019年3月23日

论具身学习及其设计：基于具身认知的视角

MOOC

15+阅读 · 2019年2月18日

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

机器之心

17+阅读 · 2019年2月11日

对人工神经网络“开刀”，利用神经科学消融法检测人工神经网络

人工智能学家

3+阅读 · 2019年1月16日

未来人类会关注可解释性吗？

待字闺中

5+阅读 · 2018年8月9日

AI综述专栏|神经科学启发的人工智能

人工智能前沿讲习班

5+阅读 · 2018年7月11日

观点 | 善于单挑却难以协作，构建多智能体AI系统为何如此之难？

机器之心

4+阅读 · 2018年4月1日

神经网络可解释性最新进展

专知

18+阅读 · 2018年3月10日

Towards a Human-like Open-Domain Chatbot

Arxiv

14+阅读 · 2020年1月27日

Question Generation by Transformers

Arxiv

5+阅读 · 2019年9月14日

Message Passing for Complex Question Answering over Knowledge Graphs

Arxiv

6+阅读 · 2019年8月19日

q-Space Novelty Detection with Variational Autoencoders

Arxiv

3+阅读 · 2018年10月25日

Interpretable Convolutional Neural Networks via Feedforward Design

Arxiv

4+阅读 · 2018年10月5日

Next Item Recommendation with Self-Attention

Arxiv

5+阅读 · 2018年8月25日

Neural Models for Key Phrase Detection and Question Generation

Arxiv

4+阅读 · 2018年5月30日

Training a Ranking Function for Open-Domain Question Answering

Arxiv

5+阅读 · 2018年4月12日

Transferring Common-Sense Knowledge for Object Detection

Arxiv

12+阅读 · 2018年4月3日

Interpretable Counting for Visual Question Answering

Arxiv

3+阅读 · 2017年12月23日

VIP会员