视知觉科学迄今已有200年历史,对于“知觉过程从哪里开始?先看见树木还是先看见森林?”这一根本问题的争论从没停止过。在近代的知觉研究中,强调视知觉过程是从局部到整体的初期特征分析的理论路线一直占统治地位。
中国科学院院士、著名认知科学家陈霖
而36年前,一个名不见经传的中国人在国际权威学术刊物《科学》杂志上发表了一篇论文,独创性地提出了“大范围首先”的拓扑性质初期知觉理论,向半个世纪以来占统治地位的“局部首先”的初期特征分析理论提出了挑战。这是他在视知觉研究领域的独创性贡献,这一理论也被称之为“陈霖的拓扑性质知觉理论”。
这是改革开放后中国学者在《科学》上发表的第一篇科学论文。论文的唯一作者陈霖,当时既没有学位也没有职称。30年时间里,在与持不同学术观点的学者的争论与交流中,他用令人信服的实验不断完善和论证着这一假说,使之成为被越来越多的国际同行所接受的学说,进而成为有国际影响力的理论。
陈霖1982年发表在Science上的《视知觉的拓扑结构》一文
2003年,因在视知觉研究领域的独特性贡献,陈霖当选中国科学院院士,成为著名心理学家潘菽院士去世15年以后,中国科学院唯一一位心理学院士。
“毛头小子”曾勇于挑战世界权威
认知科学是研究人类感知和思维信息处理过程的科学,包括从感觉的输入到复杂问题求解,从人类个体到人类社会的智能活动,以及人类智能和机器智能的性质。认知科学是现代心理学、信息科学、神经科学、数学、科学语言学、人类学乃至自然哲学等学科交叉发展的结果。认知科学的兴起和发展标志着对以人类为中心的认知和智能活动的研究已进入到新的阶段。
在人们的常识中,一个物体是由部分构成的,局部先于整体似乎不容怀疑。近代知觉研究中,主流观点都认为视觉过程是从局部到整体。然而,通过分析知觉研究面临的各种根本性困难,陈霖认为,物理或计算的简单并不一定意味着心理学的简单,或者知觉的简单。视知觉乃至认知科学其他领域研究中所遇到的各种根本性困难,可能正是来源于由局部到整体的错误假设。
1982年,当时“名不见经传”的陈霖在《科学》杂志上发表题为《视知觉中的拓扑结构》一文,原创性地提出知觉拓扑结构和功能层次的理论。与传统的初期特征分析理论根本不同,他认为,知觉活动主要是由大范围向局部进行的,而且这种大范围性质可以用拓扑性质来描述,以大范围拓扑不变性质为基础的各级几何不变性质是图形知觉的基本表达。
这一观点刚提出来的时候,几乎所有的主流科学家都反对他。他没有放弃,甘坐“冷板凳”,坚持自己的看法,并不断用科学方法加以验证。经过近30年的研究表明,人的视觉过程是从知觉的大范围性质开始的。“大范围首先”的拓扑性质知觉理论,为知觉组织研究提供了一个科学准确描述的不变性知觉的系统理论。陈霖不仅把这个理论应用到视觉问题,而且成功地应用到注意、记忆、意识乃至情绪等广泛不同认知层次的研究。
新一代人工智能的核心基础科学问题是认知和计算的关系
作为我国认知科学领域首屈一指的领军人物,陈霖应邀出席了国内首个关注认知科学、神经科学与AI交叉融合的高端学术会议——中国认知计算和混合智能学术大会(CCHI 2018),并作了题为《新一代人工智能的核心基础科学问题:认知和计算的关系》的大会报告。
陈霖在CCHI 2018作大会报告
想要成为人工智能领域的真正意义上的科学强国,离不开对人工智能的基础研究。图灵的计算模型,回答了什么是计算的问题,奠定了计算机科学的基础;香农的通信数学原理,回答了什么是信息的问题,奠定了信息科学的基础。那么,新一代人工智能的核心基础科学问题是什么?我们能否建立回答这些问题的原创系统理论?这是陈霖长期以来不断孜孜以求的目标。
通过总结认知科学研究近四十年来的发展经验,陈霖认为,发展新一代人工智能的核心基础科学问题是:认知和计算的关系。例如,要回答人工智能会不会取代人类智力这个被广泛关注的问题,凝炼成科学问题,本质上是要回答认知和计算的关系问题。
陈霖进一步将认知和计算的关系细化为四个方面的关系:
(1)认知的基本单元和计算的基本单元的关系
研究任何一种过程,建立任何一种过程的科学理论,必须回答一个根本的问题:这种过程操作的基本单元是什么。每门基础科学都有其特定的基本单元,例如高能物理的基本粒子,遗传学的基因,计算理论的符号,信息论的比特。大量的认知科学实验事实表明,认知的基本单元是知觉“物体(Object)、组块(Chunk)、时间格式塔(Temporal Gestalt)”之类的表达。
陈霖认为,由计算理论创始人David Marr提出的“物体同一性”概念、诺贝尔奖得主Kahneman的基于物体理论、认知心理学奠基人George Miller提出的工作记忆“Chunk”理论以及德国科学院院士Ernst Poeppel提出的“时间格式塔”理论等来自不同认知科学领军人物提出的经典范例的重要性在于,它们不是借用于其它科学(信息学、物理学),不是来源于物理的逻辑或计算的分析。它们原创根源于认知科学的实验发现,对认知的理解具有不可替代的意义,是适合描述认知精神世界的基本变量。
然而,上述问题来自不同的认知层次,这些问题都是提出数十年后仍然没有解决的难题。那么能否建立描述属于它们共同的本质的认知单元的统一模型?陈霖认为,“大范围首先”的知觉物体的拓扑学模型是认知基本单元的理论模型,并就知觉物体的拓扑学定义、空间和时间组织的统一模型展开论述。
知觉物体的拓扑学定义:在形状改变变换下保持不变的整体同一性的拓扑学描述。
如何科学准确地定义知觉物体,是目前认知科学领域最具挑战性、原创性的重大科学问题之一,对此,陈霖提出了“大范围首先”的拓扑性质知觉理论。视觉过程是从大范围性质开始的,这种大范围性质可以用拓扑性质来描述。而“知觉物体”的核心含义在于,在形状改变的变换下仍然保持不变的整体同一性。
如何科学准确地定义“Chunk”是目前工作记忆领域最具挑战性、原创性的重大科学问题之一。陈霖提出了“大范围首先”的工作记忆基本单元理论。“Chunk”的核心含义在于,由“grouping”,“belongingness”,“what goes with what”形成的整体性。
体现在不同认知层次的基本单元(如知觉物体、组块、时间格式塔等)的共同本质——同一性和不变性,可以定义为容限空间上的大范围拓扑不变性质。陈霖指出,各个认知层次(包括知觉、注意、学习、记忆、数的认知、发展和进化、情绪、意识)的实验,一致支持了“大范围首先”的认知基本单元拓扑学定义。
空间和时间组织的统一模型:拓扑性质改变产生时-空格式塔(知觉物体)
经典的注意研究集中在空间因素,很少研究时间因素,更少考虑时间和空间因素整合的时-空统一的概念模型。
对此,陈霖提出了整合空间和时间组织的认知基本单元概念模型。具体而言,空间相邻性或时间相邻性的拓扑性质改变,产生一个时-空格式塔(时-空组织统一的认知基本单元),在其时间窗口内保持其不变性,同时抑制拓扑性质不等价的其它基本单元的表述。
陈霖指出,拓扑性质改变产生时-空格式塔的模型五要素包括:拓扑性质改变和拓扑性质分辨的不同功能和机制:前者是new object的产生,后者是potential object的组织;时间-空间组织统一的模型,“拓扑性质改变”不仅是基于空间proximity,而且基于时间proximity;Bottom-up和top-down的关系,Bottom-up的优先性;拓扑性质改变产生新物体是快速和增强的过程,物体保持同一性是持续和压制其他物体的过程;“a spatial-temporal gestalt”是一个抽象的概念,不局限于具体的物理空间,而是抽象的时空统一的表达,所以称为时空统一的“space-time worm”。
陈霖认为,超越直觉的理解,科学准确地定义认知基本单元,建立统一的认知基本单元模型,对于发展新一代人工智能具有基本重要的意义。
(2)认知神经表达的解剖结构和人工智能计算的体系结构的关系
大脑是由结构和功能相对独立的多个脑区组成的。这种模块性的结构,不同于计算机的中心处理器和统一记忆存储器的体系结构。最近的研究发现,视网膜最内层一种名为ipRGCs(内部感光视网膜神经节细胞)的细胞在视觉成像中发挥重要作用,对拓扑性质的检测既是充分优势必要的。
陈霖认为,ipRGCs的发现是近十年来神经科学最重大的发现之一。它的发现导致了对眼睛功能的完全重新的认识。此前的研究认为,ipRGCs能表达黑视素,并调控着多种与光照相关的生理过程。破坏ipRGCs功能会导致昼夜生物钟功能丧失,使瞳孔对光反应混乱。而研究人员最新发现,ipRGCs并非都一样,而是存在两个完全不同的光感受器系统,一个是基于视杆视锥的视觉系统,另一个是基于视黑素的非图像功能的光系统。
主流理论认为,ipRGCs没有图形知觉能力,只是昼夜和瞳孔调节。然而,根据“大范围首先”理论,由于拓扑性质知觉是视觉的基础,因此ipRGCs应该能够分辨拓扑性质。
如果说,深度学习来自神经系统的层次结构的启发。那么,起源于特定细胞的超越脑区的全脑成像,将为新一代人工智能体系结构提供深刻和丰富得多的启发。
(3)认知涌现的特有精神活动现象和计算涌现的特有信息处理现象的关系
如果意识是认知涌现的一种特有现象,如何把人工智能是否会产生意识的直觉思辨式的讨论,变成科学实验的研究?
陈霖认为,应当在意识的认知机智、意识的神经表达、意识的进化以及意识的异常等方面,开展比较研究。
(4)认知的数学基础和计算的数学基础的关系
无论是经典的计算理论还是目前流行的贝叶斯计算理论,都认为认知过程的本质是图灵意义的离散符号的计算。计算的数学基础是图灵机。
陈霖认为,目前流行的基于计算概念的数学,不能满意地解释实验发现的诸多亟待解释的基本认知现象,例如:知觉物体、组块、时间格式塔、“大范围首先”,不变性直接知觉,认知偏向,意识涌现,ipRGCs的拓扑性质分辨等。
对此,陈霖及其团队利用有限空间的代数拓扑学、Klein's Erlangen Program来理解和分析“大范围首先”,并且正在提出和发展适合描述认知的新的数学框架,包括认知基本单元(概念格的“知觉物体”刻画),认知基本关系(半序的“容限”表征),认知基本操作(泛拓扑的认知过程描述)的数学,以及探索“大范围首先”的量子理论模型。
具体来说,Minsky的Perceptron平行计算模型奠定了分析高复杂性拓扑性质计算和“大范围首先”拓扑性质知觉关系的数学基础;Zeeman的容限空间代数拓扑学同调论奠定了“大范围首先”的知觉组织的数学基础;Klein的Erlangen的纲领奠定了“大范围首先”的不变性直接知觉的数学基础。
认知和计算的关系的研究使得数学与认知在各自最本源地方相汇,这正是把炼金术转化为化学,对新一代人工智能的数学基础的探索。
发展认知科学的三点布局建议
认知和计算关系的问题需要长期探索,应当得到持续的支持。就认知科学的学科特点,陈霖建议布局以下三个方面:
(1)重视认知科学的新变量、新概念和新原则的研究。目前脑科学发展的一个趋势是,脑的生物学数据前所未有地大量涌现,计算和信息的概念被普遍地借用到认知过程的分析。但是一个相对被忽视的问题是,如何在认知心理的层次来理解这些空前丰富的生物学层次的数据?这样的问题超越了生物学的层次,必须要有认知科学层次的、适合描述认知的新概念和新原则来回答。
(2)人工智能的基础研究应当强调系统、整体和行为的研究,应当人类为主,动物为辅;宏观为主,结合微观。
(3)认知和计算的关系的问题,例如什么是认知基本单元的问题,不能单靠物理的逻辑和计算的分析来解决,根本上只有通过实验来回答。因此,人工智能的基础研究要特别支持认知科学的实验研究,要注重认知科学实验为基础的学科交叉。
没有严肃的学术批评就没有“大范围首先”理论的今天
回顾过去30年来的研究,陈霖认为,对“大范围首先”理论的建立和系统的发展,是一条漫长而艰辛的道路。
严格、健康的科学批评文化对于科学的发展是至关重要的。如果不是一开始就进入到国际水平的学术批评环境中接受严格甚至严酷的锻炼,可能就没有“大范围首先”的拓扑性质知觉理论的今天。
2003年,陈霖和同事在《科学》上发表有关拓扑知觉理论的脑成像的生物学证据的论文。为了发表这篇论文,陈霖和他的同事们花了近5年的时间,其中包括《科学》杂志的严格审稿过程,跟审稿人的多次讨论,甚至补充新的实验,陈霖笑称这个过程就可以写一本书。
与主流观点相抗衡了近30 年,坚持下来的陈霖和他的同事们、研究生们,已经不仅把这个理论应用到视觉问题,而且成功地应用到注意、记忆、意识乃至情绪等广泛不同认知层次的研究。陈霖表示,这样广泛的实验证据可以说明,我们做对了一件事,就是经过近30年的努力,我们找对了一个适合描述认知心理过程的基本变量,即拓扑性质定义的“知觉物体”可能是认知过程操作的基本单元。“如今,我们的理论已进入到‘说它不对比说它对还要困难’的阶段。”陈霖自信地说。
来源:德先生
往期文章推荐
🔗【评选活动】“中国自动化学会企业创新奖”“杰出自动化工程师奖”“中国自动化学会小微创业奖”“智慧系统创新解决方案奖”评选活动启动
🔗【ASSIA 7】中国自动化学会第7期智能自动化学科前沿讲习班通知(含具体日程)
🔗【通知】关于举办科普中国•2018互联网科普产品征集活动的通知