前沿 | 详解Microns项目：通过大脑逆向工程来创造通用人工智能

2017 年 5 月 31 日 机器之心

选自IEEE Spectrum

机器之心编译

参与：黄小天、晏奇、李亚洲

去年，美国高级情报研究计划署（Intelligence Advanced Research Projects Agency, IARPA）资助了一个非常有野心的新项目 Microns，希望通过解码大脑算法来彻底改变机器学习；近日，这一项目又在 IEEE Spectrum 上发表了其最新进展，它通过逆向工程一立方毫米的老鼠大脑组织以为人工神经网络带来更多启迪，希望解决人工智能的最大挑战之一：「one-shot learning」。机器之心对该文进行了编译，原文链接请见文末。

当今，人工智能可以在诸如国际象棋、围棋和德州扑克这样的复杂游戏中打败人类；在飞行模拟器中，它们可以击落人类顶级飞行员；在更精确的外科缝合手术与癌症诊断方面，人工智能也正在超越着医生。但是在一些其他情况中，一个三岁的小孩又可以轻松击败世界上最高级的人工智能：当比赛涉及的一种学习是如此常规，以至于人类甚至没有意识到正在做它。

这一幕曾发生在 David Cox 身上，一位来自哈佛大学的神经科学家、人工智能专家以及一个三岁孩子的自豪爸爸。他的女儿在自然历史博物馆看到一个长腿的骨架，并指着它说，「这是骆驼」。之前，她唯一一次看到骆驼是在几月前的图画册上。

人工智能研究者将这种基于单一实例辨识对象的能力称为「one-shot learning」。今天，人工智能系统获取智能的主流方式是深度学习。通常，在深度学习的自动化训练方法中，我们向程序输入大量数据并输出结论。为了训练一个人工智能骆驼探测器，系统首先需要输入数以千计、各式各样的骆驼图像，并把图像全标注为「骆驼」；同时也需要相等数量的其他图像并标注为「非骆驼」。一旦系统读取了所有数据并确定了骆驼的独特属性，它就成了一台好的骆驼探测器。但是相比于孩童，人工智能的时间成本很高。在人工智能学习识别骆驼的时候，Cox 的女儿早已识别出了长颈鹿和鸭嘴兽。

插画家：Chad Hagen

Cox 在解释美国政府名为 Machine Intelligence from Cortical Networks（Microns）时，提到了自己的女儿。这是一个有野心的项目：逆向工程人类智能，以便于计算机科学家能建立更好的人工智能。首先，神经科学家的任务是发现大脑湿软灰质中的工作策略，然后数据团队将这些策略转换为算法。人工智能中的一大挑战就是 one-shot learning，Cox 说，「人类在推理与归纳上有着惊人的能力，这也是我们尝试抓取的能力。」

由高级情报研究计划署（Intelligence Advanced Research Projects Agency, IARPA）资助达 1 亿美元的为期 5 年的项目，紧密围绕视觉皮层展开研究，我们知道，视觉皮层是大脑处理大量视觉信息的地方。三个 Microns 团队试图通过使用小鼠和大鼠绘制出 1 立方毫米脑组织的神经元结构。这听起来可能不复杂，不过要知道，就是这一点组织就包含了多达 50000 个互相连接的神经元，它们形成了近 5 亿个突触。研究者希望能够很清晰地了解这些连接的具体情况，因为这可以让他们发现当视觉皮层进行工作时相关哪些神经「电路」受到了激发。该项目需要可以在纳米水平分辨率显示单个神经元的专业脑成像技术，然而这种技术之前还从未在这种规模的脑组织上尝试过。

尽管每个 Microns 团队都涉到了多个研究机构，但是大部分由哈佛大学分子细胞生物学与计算机科学助理教授 Cox 领导的参与者都在哈佛大学校园内的同一幢楼内工作。其中你可以看见在为大鼠准备的「视频游戏」（视频请参见原文链接）里，这些啮齿动物们正进行着忙碌的工作；旁边放着一台如同世上最精准的薄片切片机在对大脑进行切片；在一旁你还会看见全球最快最强大的显微镜。在这些设备和所有人的共同努力下，Cox 认为它们可以完成破译这一立方毫米组织的艰巨任务。

这里试着简单解释一下人类心智强大能力的来源。为了处理关于这个世界的信息以及让你的身体保持工作，电脉冲在你颅骨中 860 亿包裹成海绵状组织的神经元间闪过。每个神经元都有一个长长的轴突，它可以在组织之间穿梭，从而使神经元可以和其它成千上万个神经元进行连接，以此方式，最终形成上万亿个连接。人类的每个体验都有一个对应的电脉冲模式：如我们摆动手指、消化午餐、坠入爱河或是认出一只骆驼。

双光子激发显微镜：在活体动物的大脑组织工作时，用此强大的红外激光扫描大脑组织（右）。在两个光子同时击中一个活跃神经元时，它们导致一个荧光标签散发另一种波长的光子。显微镜记录下的视频演示了这些光亮。David Cox 说，「你可以看到老鼠也有思想。」

从上世纪 40 年代开始，计算机科学家就尝试模仿大脑，设计了一种名为人工神经网络的软件结构。如今大部人工智能构想都使用到了该结构变体：有深度神经网络、卷积神经网络、循环神经网络，等等。受大脑结构的启发，这些网络包含许多计算节点（被称为人工神经元）来完成小的离散式任务；它们彼此连接，可让整个系统完成惊人的任务。

神经网络不能再进一步复制大脑的结构，因为科学界对神经元回路的基础信息还缺乏了解。IARPA Microns 项目的经理 R.Jacob Vogelstein 说，研究人员们在微观、宏观层面上都有典型的研究。「我们使用的工具既刺探单个神经元，也聚集整个大脑的信号。最大的差距是理解回路上的运算，数千个神经元如何一起处理信息。」

这种情况近来发生了改变，技术的进步使得神经科学家能做出「连接组（connectome）」来揭露神经元之间的众多连接。但 Microns 不只是一张静态图解。团队需要演示老鼠在看、学习、记忆时这些电路激活的方式。Vogelstein 说，「这非常类似于你逆向工程一个集成电路，你可以详细观察芯片，但除非你见到工作中的电路，不然你的观察就是无用的。」

在 IARPA，如果研究人员能够追踪到认知任务中的神经元模式，并将这些模式转变为类似大脑的架构（人工神经网络），这才会有真正的回报。Vogelstein 说，「在数学和算法上，大脑的计算策略是可被表征的。政府的赌注在于类脑人工智能系统要比之前的系统更擅于解决真实难题。毕竟，理解大脑是个宏伟目标，但智能情报部门想要人工智能不只是要识别一只骆驼，还有模糊视频中的半模糊脸孔。

在 Cox 的实验中，老鼠的游戏室是一个小空间。每个箱子中有个面向计算屏幕的老鼠，鼻子面前有两个接管。

上图：Rafael Vescovi，Narayanan Kasthuri，图片来自阿贡国家实验室；下图：阿贡国家实验室

X 射线断层成像技术：在阿贡国家实验室的高级光子源（右图），一个粒子加速器将用电子撞击一条金属丝以产生非常明亮的 X 射线，然后这些射线都会汇聚在一小块取出的脑组织上。很多角度拍摄的 X 射线图像最终会被结合起来形成一幅 3 维图像（上图），它显示了该组织内的每个神经元。

在目前的实验中，大鼠尝试掌握一门复杂的视觉任务。屏幕上显示三维的计算机生成的物体——这些物体与真实世界中的物体完全不同，它们仅仅是简单抽象的形状。当老鼠看见物体 A，它必须舔一舔位于左边的管嘴以得到一滴甜味果汁；当它看见物体 B，那么右边的管嘴里也有果汁。但是物体是在多个方向被呈现出来的，所以大鼠必须在思维中旋转每一个面来思考和决定这个物体是否满足 A 或 B。

穿插在训练环节中的是成像环节。在成像环节中，大鼠将被带到另一个实验室，那里有一台巨大的盖着黑布的显微镜，看上去就跟一台老式照相机一样。在这里，团队让动物看着一块显示有对它们现在来说熟悉的物体 A 和 B 的屏幕，然后团队会用一个双光子激发显微镜再次在很多方向上来检测动物的视觉皮层。该显微镜会记录激光照射活动神经元时的荧光闪烁，并且，该 3 维视频显示的图像类似于夏日夜晚飞舞的绿色荧火。Cox 非常渴望看到当动物对自己的任务非常熟练之后，那些图像会如何变化。

然而，实验使用的显微镜分辨率不足以很好显示连接一个个神经元的轴突。没有这个信息，研究者就不能判定一个神经元是如何去激发下一个神经元从而形成信息处理回路的。因此，为了达到这个目的，需要杀死该实验动物，其大脑才能用于进一步细致的研究。

研究人员切掉了视觉皮层的一小块，通过联邦快递送到了伊利诺伊的阿贡国家实验室。在那里，一台粒子对撞机用强大的 X 射线对单个神经元、其它大脑细胞与血管进行成像，得到一张三维图。该图当然也没有显示出组织内轴突的连接情况，但是当研究者用电子显微镜图像对比双光子显微镜图像时。「X 射线就如同罗塞塔石碑（Rosetta stone）一般。」Cox 说道。（注：罗塞塔石碑是古埃及托勒密王朝时代的产物，其上写有古埃及过往托勒密五世登基的诏书，上面用三种文字叙述了同样的内容，包括古埃及象形文、埃及草书和希腊文，这块石碑后来也成为了近代考古学家解读失传的古埃及象形文的重要参考文物。罗塞塔石碑收藏于大英博物馆。）

随后，这块脑组织被送还到哈佛大学 Jeff Lichtman 的实验室，Jeff Lichtman 是一位分子细胞生物学教授，同时他也是一位大脑连接组领域的顶尖科学家。Lichtman 的团队用一台类似于熟食切片机的机器将这块 1 立方微米的脑组织切成了单片 30 纳米厚的 33000 份。这些超薄脑片被自动放在一条带子的硅晶片之上。随后，研究者使用世界上最快的扫描电子显微镜，对每个脑样本都投射 61 束电子来测量这些电子的分布。这个冰箱大小般的机器昼夜不停的工作，力图最终生成每片 4 纳米分辨率的图像。

上图：Daniel Berger／Lichtman 实验室／哈佛大学；下图：Lichtman 实验室／哈佛大学

扫描电子显微镜：Jeff Lichtman 的扫描电子显微镜（右）在脑组织切片处发射了 61 束电子。通过测量电子如何发散，这一技术产生了 4 纳米分辨率的图像，展示了每个切片中连接神经元的轴突。一个计算机程序从一个切片到另一个切片追踪轴突，并在脑组织立方体内重建所有的神经布线（neural wiring）。

每个图像类似于密集包装的立方形意大利面的横截面。图像处理软件按照顺序排列切片，并逐个切片地进行追踪，描述每个神经元轴突及其到其他神经元数的以千计的连接的完整长度。但是软件有时无法跟踪横截面，或者把一个与另一个相混淆。在这项任务上，人类优于计算机，Cox 说，「不幸的是，地球上并没有足够多的人来追踪如此多的数据。」哈佛与麻省理工学院的软件工程师正致力于跟踪问题，他们必须解决它，以便绘制精确的大脑连接图。从双光子显微镜叠加该图与活动图应该可以揭示大脑的计算结构。例如，当老鼠看到一个奇怪的块状对象时，它应该显示哪些神经元形成了一个回路并亮起，在头脑里将其颠倒，并确定它与对象 A 匹配。

Cox 团队的另一个挑战是速度。计划的第一次阶段在 5 月结束，每个团队不得不展示测量 100 微米大脑组织块的结果。对于更小的块，Cox 团队将电子显微镜和图像重组步骤缩短为两周。现在，在第二阶段，处理相同相同任务只需数小时。从 100 微米到 1 毫米，体积增加了千倍。这就是为什么 Cox 着迷地聚焦于自动化过程的每一步——从老鼠的视频训练，到连接体的跟踪。Cox 说：「这些 IARPA 项目迫使科学研究看起来更像是工程学，我们需要快速扭转方向。」

加快实验允许 Cox 团队测试有关大脑回路的更多理论，这同样对人工智能研究者有帮助。在机器学习中，计算机科学家设置神经网络的整体架构，虽然程序本身决定如何把诸多计算连接进序列。因此，研究者计划在同一个视觉识别任务中训练老鼠和一个神经网络，并对比二者输出和连接的模式。Cox 说：「如果我们在大脑中看到某些连接模体（connectivity motif），我们不是在模型中看到它们，也许那是在暗示我们做错了什么。」

一个调查领域涉及大脑学习的规则。物体识别被认为是按层次处理的——第一组神经元处理颜色和形式等基本要素，下一组寻找边界，区分物体和背景，以此类推。随着动物在识别任务中表现的提升，研究人员找到了一个问题：哪组神经元对行动的影响最大？同时，随着人工智能在同样任务中的表现不断提升，这种识别模式的神经网络活动是否与老鼠大脑中的动作遵循相同的原理？

IARPA 希望这些发现不仅适用于计算机视觉，也可以应用到机器学习中。「我们在这里有了一个信仰的飞跃，但我认为这是一个遵循证据的信仰之跃，」Cox 说道，他指出，大脑皮层，发生高层次认知的神经组织外层都有「可疑地相似的」结构。对于神经科学和人工智能专家而言，这种一致性表明，大脑中可能存在一种基本类型的电路用于信息处理。定义这种方法或许会让我们向通用人工智能更进一步。

虽然 Cox 的团队正在转变想法，试图加快真实可靠的神经科学流程，而另外一名 Microns 研究者却在尝试一个极端想法。「如果它成功了，将会革新大脑科学，」哈佛大学怀斯生物启发工程研究所（the Wyss Institute for Biologically Inspired Engineering）的教授 George Church 说。

Church 和匹茨堡卡内基梅隆大学的李泰兴教授联合领导着 Microns 团队。Church 负责这个过程的连接组映射部分，并采取了截然不同的方法；他不使用电子显微镜跟踪轴突连接，认为这一技术太慢并会产生很多问题。Church 说：「当其他团队试图在一立方毫米的大脑皮层上跟踪轴突时，错误将会累加，并模糊连接组数据。」

Church 的方法并不受轴突的长度或被调查的大脑皮层大小的影响。他使用基因工程化的老鼠和一项被称为 DNA 条形码（DNA bar coding）的技术，该技术可通过一个独特的基因标志符（它可从其树突的边缘性尖端读取到长轴突的末端）给每一个神经元打标签。他说：「如果你有一些巨大的长轴突也没关系，借助条形码你可以发现两个末端，这个过程中有多少困惑也并不紧要。」Church 团队使用的大脑皮层切片厚度为 20 微米（μm），厚于 Cox 团队的 30 纳米（nm），因为他们并不担心在切片之间丢失轴突路径。DNA 测序机纪录了当前给定大脑皮层切片中的所有条形码，然后程序通过所有的基因信息进行分类，以绘制展示神经元之间如何彼此连接。

Church 还有一个合作者 Anthony Zador，他是纽约冷泉港实验室（Cold Spring Harbor Laboratory）的神经科学教授；他们一起证明了在之前的实验中，条形码和测序技术奏效；但是 Microns 项目需要聚合所有数据并放入连接组图谱中，他们并没有做到。假设他们做到了，Church 说，「Microns 将只会注意到他大脑测绘工作的开始：接下里他想要绘制整个小鼠大脑的所有连接，即 7 亿个神经元和 700 亿个连接。」他又说：「1 立方毫米使人一叶蔽目，我想要的远不止于此。」

上图：Tony Zador/纽约冷泉港实验室；下图：Eliza Strickland

荧光原位序列：每个神经元有一个「RNA 条形码」，它由被称作碱基（bases）的分子的独特序列组成。测序机（右）通过记录与四种类型的碱基相连接的不同颜色的闪光灯读取条形码。George Church 团队绘制了这些条形码在大脑皮层中出现的地方以展示神经元在何处相互连接（上）。

如此大规模的图谱将为人工智能的发展带来启发，做到更严谨地模仿生物大脑；但是喜欢做解构者的 Church 为计算指明了另一条道路：停止尝试打造硅大脑（意指计算机），而是构建生物大脑，代替人类更好地处理计算任务。他说：「我认为很快我们就会有合成神经生物学（synthetic neurobiology）的能力，以真正地构建生物大脑的变体；尽管硅芯片计算机在处理速度方面打败了生物系统，但 Church 想象装备有电路元件的工程化大脑也将会实现提速。」

按照 Church 的评估，Microns 大脑逆向工程的目标也许不可实现。大脑是如此复杂，以至于即使大脑逆向工程取成功了，研究者还是无法完全理解大脑的神秘，但这并无大碍。Church 最后说：「我认为理解大脑有点像是科学家的一种执念，对大脑做逆向工程要比理解它容易得多。」