脑科学以阐明脑和神经系统的工作原理和机制为目标,被认为是自然科学的“最后疆域”。近年来,随着人工智能技术取得突破性进展,脑科学的巨大潜力再次受到各国政府和科学界的高度重视。自2013年起,美国、欧洲、日本、韩国等相继启动大型脑科学项目,中国于2016年也计划推出相关项目。
“脑科学与类脑科学研究”(Brain Science and Brain-Like Intelligence Technology)简称为“中国脑计划”,主要有两个研究方向:以探索大脑秘密、攻克大脑疾病为导向的脑科学研究以及以建立和发展人工智能技术为导向的类脑研究。“十三五”时期,脑科学与类脑研究被纳入“科技创新2030—重大项目”,将“以脑认知原理为主体,以类脑计算与脑机智能、脑重大疾病诊治为两翼,搭建关键技术平台,抢占脑科学前沿研究制高点”。
对大脑的研究、以及对以此为基础的人工智能的研究,早已脱离了单个学科可以应对的范畴,而需要多个学科领域之间的相互协作。只有最顶尖的人才才能理解,并最终推动这些领域的整体进步。而今天将要介绍的这位院士,在“中国脑计划”中起着运筹帷幄的关键作用。他就是中国科学院院士、中科院神经科学研究所所长蒲慕明。
40多年研究成就神经科学巨擘
蒲慕明出生于南京,成长于台湾,求学于美国,担任神经所首任所长至今近20年。值得一提的是,他是中科院历史上第一位外籍所长。然而,心系祖国脑科学事业的他,在2017年选择了放弃美国国籍,恢复了中国国籍。
在他长达40多年的研究生涯中,蒲慕明在神经科学的多个领域中都做出了卓越的贡献。1974年,他第一个测量了分子在细胞膜上的扩散运动速率,由他建立的“光漂白”技术至今仍是测量细胞内蛋白质运动速度的标准方法。
蒲慕明(左一)在南开大学庆祝中国第一台自制单通道电记录仪成功。中科院神经所提供
1981年,时任美国加州大学尔湾分校生理系副教授的蒲慕明,为学校和北京医学院联合开办的细胞生理讲习班授课,这是他离开大陆32年后第一次回国。一年后,蒲慕明帮助南开大学生物物理实验室研制单离子通道电记录仪,他从美国带回来的低噪音放大器和图纸派上了用场,中国第一台自制单离子通道电记录仪就此建成。1983年,他又到了清华大学开了一个全国性的生物物理讲习班。
1984年9月,蒲慕明(左三)出任清华大学生物科学与技术系首任系主任。中科院神经所提供
1999年,蒲慕明“临危受命”,创建中科院神经所并担任首任所长。当时的脑研究所只剩下3个研究组,科研陷入了困境。在蒲慕明带领下,仅用了短短4年,神经所的13个研究组,就突破了中国生命科学领域在国际一流学术期刊发表论文的纪录。2009年,蒲慕明组建了脑疾病研究中心,建设了非人灵长类平台。2016年,蒲慕明团队构建出世界上首个非人灵长类自闭症模型。2017年,在蒲慕明的主导下,神经所诞生了世界上第一个体细胞克隆猴。
传统教科书上写着,神经细胞的轴突导向是由导向分子本身特性所决定,蒲慕明却提出了一个崭新的概念,认为神经轴突对导向分子的反应是依据神经元内部第二信使水平而决定的。过去一般认为神经营养因子的主要功能是维持神经细胞的存活,蒲慕明的工作却指出神经营养因子对突触的转递功能有快速的强化作用,从而开辟了“神经营养因子与突触可塑性”新的研究领域。蒲慕明的工作还极大地促进了人们对大脑可塑性在神经细胞层面的认识,即大脑神经细胞是如何形成新的连接,以及如何依据电活动的时序改变已有连接强度。
蒲慕明2009年当选美国国家科学院院士,2011年当选中国科学院外籍院士。2016年获得世界神经科学领域有极高声誉的格鲁伯奖,以表彰他在大脑神经可塑性的分子和细胞机制研究方面所做的开创性工作。
脑科学能为人工智能带来什么?
在日前举行的中国认知计算和混合智能学术大会(CCHI 2018)上,蒲慕明受邀出席了大会,并作了题为《脑科学对类脑人工智能可能有的贡献》的大会报告,详细讲解了目前在神经科学领域研究的最新进展。
脑科学主要研究的对象是人类的大脑,脑科学目前的研究还处在早期的阶段,而大脑中神经网络和神经元与人类认知之间具有非常复杂的关系。
在蒲慕明看来,人脑的认知可以分为三个层面:对外界的认知、自我与非我的认知、对语言的认知。对大脑如何进行这些认知功能的理解将有助于未来类脑人工智能的研发有所贡献,但是目前存在的问题是脑科学对大脑在这三个(尤其后两个)层面机制的理解仍极为粗浅。人们在理解视觉、听觉、嗅觉等感觉信号加工的神经环路机制上取得了不错的进展,但对于复杂功能,如学习、记忆、注意、决策,还知之甚少,更不用说共情、自我意识、思考和语言了。
“脑科学”关注的是大脑,而大脑最主要的一个部位就是大脑皮层,这是人类最发达的一个部位。大脑之下的很多结构是皮层下结构,从猴到黑猩猩到人,皮层的结构大大的增长,这就是人类认知的主要来源。人的大脑有上千亿的神经细胞,称之为神经元。神经元是有结构的细胞,有输入端也有输出端,输入端像树枝一样,输出端是一个轴突,输入段是一个树突。神经元通过连接组成一个复杂的神经网络,进行各种感知运动思维各种功能。
如何能对类脑人工智能有贡献?蒲慕明认为,其中一个重点是反向传播算法对脑研究的启发,即脑科学在启发人工智能的研究的同时,人工智能的研究也会启发脑科学的发现。对此,蒲慕明做了进一步探讨,希望能以其自身在反向传播算法和脑科学研究的经验来展示人工智能研究确实会启示脑科学研究。
至于反向传播算法如何影响脑科学的研究,蒲慕明团队此前进行的实验能观察到这一现象。在体外培养的神经元里,神经元可以相互产生连接,我们可以用这四个神经元记录其电位反应(如图所示)。这四个神经元之间可以产生16个连接,我们就可以测量这16个连接里是否产生了权重的改变,即产生了LTP(长时程增强,短时间快速重复高频刺激传入N元,突触传递效率长时程增强)。比如说我们刺激神经元由E2到E1,那么现在观察上游和下游的神经元突触到底有没有变化。
图:四个神经元电位反应实验结果
在实验中有九个连接有神经反应,其中的三个连接也有强化现象。强化现象不是说会产生记忆储存的地方,其可以传到网络里面其他的突触,这个现象我们称逆向传播;而且不仅有逆向传播,还有侧向传播。这个现象与在神经网络中的情况很相似。最后他们的试验结果表明,假定一个突触产生了LTP(Long-Term Potentiation长时增强)或LTD(Long-Term Depression长时抑制),那么神经元就会将这一信息反向传播,产生强化就会增强电位差,弱化就会削弱电位差。这里与反向传播算法传递误差类似,因为产生错误就会得到电位抑制,也就是产生LTD,那么这一弱化信号反向传递到其他神经元就会得出相似的效果并得以更新电位差与神经元状态。
蒲慕明认为,大脑最关键的是学习和记忆,学习和记忆也是人工网络关键的功能。人工网络在过去几十年来,从脑科学得到的最关键的一个启发,就是神经的可塑性。
感觉运动认知行为发生的时候各种相关的活动,有一个作用,这个作用是改变神经元或者突触功能或结构的修饰,这种修饰就叫做可塑性。一旦修饰之后,这个神经系统变成另外一个状态,这个状态就是有了记忆、有了学习、有了认知行为的改变,所以可塑性可以说是所有认知行为的基础。人工网络过去这50年最大的研究进展,就是理解了可塑性来源。
在报告中,蒲慕明介绍了著名的赫伯假说以及赫伯假说对于神经科学研究的作用。电活动怎样造成神经系统变化?假如两个神经细胞里面有同步电活动,它们之间的突触连接就要加强或者稳固;假如不同步,这个突触就削弱或者是消失,这种概念我们叫做赫伯学习法则。这个法则在上世纪70年代、80年代得到了实验证据,这个证据也是神经科学重大进展——发现了电活动可以造成突触的长期强化或者长期弱化现象。LTP跟LTD是可塑性的关键,突触可以强化或者弱化。假如用高频刺激一秒钟,刺激前突触电位是一个幅度,刺激一秒钟之后幅度突然上升,并且这个上升的幅度可以维持长时期,就是长期强化现象。低频刺激,结果是相反的,效率是下降的,变成弱化现象。
蒲慕明认为,赫伯假说中可塑性的基础是突触强化或者弱化同步活动造成的。由于感知信息来了之后,大脑里同步的电活动强化了一群神经元之间的联系。比如对于一个圆圈的感知,这个圆形激活了一大批细胞,每个细胞都是对圆形的曲线段有反映。这些细胞都是在圆形出现后一起被激活,它的连接就加强了,所以得到了一个神经细胞集群的连接加强。加强后,只要有部分信息来了,它就可以通过原来已经加强的连接唤起整个记忆,圆形的记忆就出来了。所以说明记忆的产生,就是靠着这样把神经之间的连接加强,通过同步的电活动进行。其中,“祖母概念”就是其中一个具有典型代表性的例子。
鉴于大脑神经网络在信息处理、储存、提取的高效节能的特性源于网络架构的形成过程、突触可塑性的调控和记忆储存的机制。蒲慕明提出了五个可借鉴的自然神经网络特性,即:(1)神经元种类;(2)顺向、逆向、侧向神经联接;(3)神经突触的可塑性;(4)记忆的贮存、提取和消退;(5)赫伯神经元集群概念的应用。
(1)神经元种类
蒲慕明认为,神经系统的关键是抑制性的神经元,没有抑制性神经元很多功能就不能出现。抑制性的和兴奋性的神经元还有亚型,每一个单元并非都具备同样的性质。某些输出对高频信号有反应,对低频没有反应,亚型有各种信号传递的特性,需要更进一步的分析。这是未来可以同人工智能结合起来的思考。
(2)顺向、逆向、侧向神经联接
神经网络有顺向的网络,也有逆向和侧向的网络,这些都可以进行抑制性或者兴奋性联接。局部网络里面最关键有三种网络:一种是Feedback网络,神经元被激活之后,轴突输出到旁边的抑制性神经元后回来抑制自己,不是无限制地不断升高,是可以压制高幅度的电活动;第二个是Feed-forward网络,除了输入兴奋性神经元,同样的输入到旁边的抑制性神经元,通过延迟信号来抑制神经元;第三种是旁侧网络,把神经系统一连串的信息尖锐化。因为有一个抑制性延迟,所以开始的时候有信息。可以强化中间这个被刺激的神经元,通过侧向的抑制,使旁边下降,这样可以突出该强化的通路,不该强化的通路被压下去,这些都是抑制性神经元造成的。
(3)神经突触的可塑性
神经突触可塑性是最重要的一类。功能的可塑性,即效率的增强或减低,LTP跟LTD是最常见的。但是,增强和削弱的规律是什么,依赖突触前后电活动的频率决定LTP或LTD,但也可以依赖突触前跟突触后的电发放顺序。另外一个就是结构可塑性,突触在发育过程中有新生的有修剪,在实验室已经把这个联接可变性加入进去,发现有很大的功能。还有一个就是可塑性的传播,LTD的传播是BP的来源,但是LTP为什么不可以传播?传播为什么一定要指定?蒲慕明认为,可以有自己的逆向传播、侧向传播,而且是可以自发的,不需要指令的神经元自己有序地传播来进行突触的变化。
(4)记忆的贮存、提取和消退
记忆是是突触群在感知记忆或者其他记忆激活的时候之间联接增强或者结构修剪,是在进行处理的网络上的储存。这个储存的修饰在神经系统里面随时间消退,LTP、LTD不是长期的,不是所有的突触都可以强化,都可以弱化的,这样的话没有意义的信息就可以遗忘。记忆储存是什么?在这个网络中使部分突触群的活动在线就可以把这个记忆提取出来,最后利用强化学习,通过输出信息增强或减弱来修改跟这个功能相关的突触群的修饰。
(5)赫伯神经元集群概念的应用
赫伯神经元集群概念可以用来做图像记忆、概念形成。嵌套式集群加入STDP之后可以变成时序,包括语言信息的储存也是嵌套的。集群怎么形成?这个句子出现的时候产生的集群,跟另外一句话的集群不一样。同样的一个字、一个语句,在不同的句子里面意义不一样,就是因为不同的集群里面产生了连接。所以,这个集群可以把多成分、多模态的信息放在一起,视觉的、听觉的、嗅觉的,都可以连在一起,不同模态的信息在网络的不同区域进行处理。在神经网络里面、自然网络里面,怎样捆绑不同模态的信息呢?用同步活动的震荡。同步的震荡在不同区域同时震荡,或者震荡有一个相差,一个先一个后,这也是同步来捆绑各种集群,输入信息。在神经系统很重要的是图谱,有些图谱结构在人工网络里面已经开始使用了。
蒲慕明表示,脑科学与类脑人工智能的协同发展将是未来人工智能发展的关键。人工智能现在是方兴未艾,可以做的事情很多,而且发展还有很大的前景。但是我们考虑未来的下一代人工智能,五年、十年、十五年之后,人工智能会需要更智能,首先需要知道我们目前的人工智能是专用的,不是通用的。我们现在最关键的技术——深度学习,机器学习的方法是大数据,高能耗,跟人脑比起来是差远了。所以怎么样从监督学习进入到非监督学习,像人脑一样,怎么像人脑那样有效率,我们应该从脑科学里得到一些启发。
本文部分内容整理自蒲慕明在CCHI 2018的大会报告内容,题目《脑科学对类脑人工智能可能有的贡献》
部分内容参考自:《独家专访|中科院第一位外籍所长蒲慕明恢复中国国籍,“我从来都认为自己是中国人”》,上观新闻,2018-06-27
推荐阅读