公元前245年,古希腊叙拉古城的赫农王命令工匠制作一顶纯金的王冠。工匠完工后,国王感觉不放心,对着重量没变的王冠左看看,右看看,总怀疑工匠把里面的金子换成其他材料了。可是,没证据又不好明说。跟大臣们说起此事,他们也只能面面相觑。于是,国王按一大臣的建议,请来了当时最有名的数学家阿基米德帮助鉴定。阿基米德看了半天,也没弄明白要怎么测。又冥思苦想了多日,还是没看出一丝端倪,便想泡个澡舒缓下心情。跨进装满水的浴盆后,他发现水的涨落似乎和他的站起坐下有关,而且坐下时还能感受到水向上对身体的托力,身体也随之变轻了。他恍然大悟,原来可以用测量固体在水中排水量的办法,来检测物体的体积。那也就能根据王冠的密度与体积之间的关系,来推测王冠是否造假了。
一瞬间他豁然开朗,跳出了澡盆,连衣服都忘记穿了,一路大声喊着”尤里卡!尤里卡”(Eureka,希腊语:εύρηκα,意思是我知道了)。阿基米德由此破解了王冠称重的难题,发现了工匠欺骗了国王。更重要的是,他因此发现了浮力定律,即物体在液体中得到的浮力,等于物体排出液体的重量。
图:阿基米德与浮力定律
科学发现靠什么呢?有不少重大的发现靠的是灵光一闪,如阿基米德洗澡时想到的浮力定律或阿基米德定律,俄国化学家门捷列夫玩扑克牌时发现的元素周期表。这种感觉可以用宋朝夏元鼎《绝句》中的“踏破铁鞋无觅处,得来全不费工夫”来形容。我国管灵光一闪叫“顿悟”,西方则把它称之为Eureka effect(尤里卡效应,或称为Aha Moment和Eureka Moment)。
与人皆有之的、来自潜意识自然反映的直觉不同,顿悟虽然也是潜意识的反映,但相对神秘。目前在学术界,关于顿悟的发生仍然争论不休。一是其在脑区发生的精确位置未知,一是在何种环境下能发生也未知。所以,阿基米德只好泡澡来启发思考,而量子电动力学的创始人之一费恩曼则爱在泡酒吧的同时顺便做研究。
从文献的总结来看,顿悟这种思维方式包括两个部分:首先是在某一问题上已经经过进行了长时间的思考,但陷入了困境。尽管尝试了能想到的各种可能性,仍不得其门而入。突然某一天在某地,令人意想不到的就有了灵感,并快速找到了问题的答案。而且,该灵感不必要依赖于原来已经僵化的解题逻辑或结构,甚至需要“跳出三界外”,才有可能获得。
一般认为,它有四个特点:1)它是突然出现的;2)对该问题的求解是流畅、平滑的;3)通常有正面效应;4)经历顿悟的人相信它的解是真实和正确的。这四个特点往往需要组合在一起才能见效,如果分开了就很难获得灵感或顿悟 [1]。
尽管关于灵感仍无合理的解释,但可以推测它的形成机制不是突然凭空在大脑中加速形成的,应该与人类已经学习好的某些结构具有关联性。那么,它和我们哪种思维方式比较相似呢?如果能找到其中的关联,也许我们就能设计具有类似创造能力的人工智能体。
我们不妨了解下人类认知中普遍采用的两种思维方式:快思维和慢思维,以及快思维中存在的直觉统计错觉[2]。
人类经历了长时间的演化,发明了语言、制造了工具、 建立了几尽完备的数学理论体系,并通过其他智能体不可能具备的、长时间的学习来帮助提高知识水平。然而,很多高阶能力并不见得会在日常生活中起主导作用。比如,我们虽然会在大学学习微积分,但绝大多数情况下,我们只需要知道用电子表格填下数字就行了。甚至在需要缜密计算时,有时候人类还是会凭自己的经验或直觉来优先进行判断。
举个极端情况的例子, 为什么在股市中专家的建议经常不怎么管用呢?实际上,多数专家在做分析时,都是按《经济学原理》来指导和建议的,目的是对投资组合进行利益最大化。总不能说经过了千锤百炼的经济学原理有严重不足吧,可为什么股民很多还是很容易被割韭菜呢?因为实际上偏好理性决策或慢思维的人并不多,尤其在股市瞬息万变的时候,能做深层次思考、计算的机会也少,股民往往会凭自己的直觉或快思维来做快速决策。可是,这些决策很多时候是远离了专家建议的最优决策。
美国普林斯顿大学的心理学教授卡纳曼和其前同事特沃斯基对人的两种思维方式进行了深入研究。他们从直觉统计学(Intuitive Statistics)的角度出发,发现了一系列有趣的现象,于1974年在Science发表了一篇社会科学领域引用最高的关于不确定性判断的论文[3],后进一步形成了展望理论(Prospect Theory,也有称前景理论)[4],并因为这些成果卡纳曼于2002年获得诺贝尔经济学奖(注:特沃斯基过早去世,因而没能获奖)。尽管获得的是经济学奖,但其理论体系详细地是阐述了智能体在认知上存在的认识误区。
他们发现人在做很多复杂任务判断时,并不会用缜密的思维去计算每个事件的概率,反而会借助于少量的启发式技巧来做更为简单、快速的判断。这些判断策略在绝大多数情况下是有效的,不然人很快就会在自然进化中被淘汰。但是,这种判断策略有时会导致严重和系统性的错误,而人类却不见得会意识到,即使是受过训练的专家也是如此。
比如我们在判定物理量如距离和大小的,常通过启发式的规则来做主观的概率评估。看得越清楚的物品通常会被认为距离更近,反之更远。虽然这种规则在一定情况下是有效的,但也可能会带来系统性误差。如在“立霾”后,就很容易把距离估得远一些,以致于有可能需要依赖听觉来辅助识路。而类似的系统性偏差在概率意义的直观、启发式判断中广泛存在着。
根据卡纳曼和特沃斯基的理论,人类在快思维中,会有三种评估概率的启发式策略:1)代表性(representativeness),常用于“当人被询问要判断一个目标或事件A属于类别或过程B的概率”的情形。2)实例或场景的可用性(Availability),常用于“当人被询问要评估一个类的频率或者一个特定发展的可能性”时。3) 从锚点的调整(Adjustment from an anchor),常用于“当一个相关值可用时的数值预测”。这三种启发式策略高度的经济,一般也有效,但它们容易产生系统偏差和预测偏差。具体来说:
1)代表性(representativeness):当测试者被给予不同的概率比例暗示时,比如做问卷调查时,告诉测试者,某人是图书馆员的概率是60%,农夫为40%。在无其它信息时,测试者会使用这些概率来判定一个人的职业;但在缺乏概率信息时,如果引入某段毫无价值但却有代表性的描述时,比如告知平时常见的图书馆员的衣着打扮,测试者就很容易被这个暗示影响,导致不正确的结论。这是由于人对于结果的先验概率的不敏感性形成的。
另外,由于人们对事件发生的可能性进行评估时往往依赖于直觉,因此很少考虑事件的样本数量影响。如小样本情况下产生的波动性要明显大于大样本。但人直觉上却很容易认为两者的波动性是一致的。这是人对于样本规模存在不敏感性引起的。
对于机会,人类也存在误解,常以为远离随机性的事件不是太可信。事实上局部有规律的行为并不会否定全局随机性,但它却会误导人们形成不合逻辑的推理。这种误解被称为赌徒谬误(gambler’s fallacy),它让人们以为一系列事件的结果会隐含某种自相关的关系。比如A事件的结果影响了B事件,就推测B是依赖于A的。比如最近天气转晴,连续几天大太阳就会让人高概率担心周末会下大雨。而赌徒则认为如果一直手气不好时,则会以为再过几把就能翻盘回本甚至赚钱。
不仅如此,在做预测时,人类更多会偏好用自己选择的材料做判断,而非真正需要预测的结果,即对可预测性不敏感。比如在招聘时面试官容易受面试表现影响,即使面试者的材料准备得更充实可信,但面试官还是会过分相信自己的判断,形成验证性错觉(Illusory of Validity)。而这种错觉最终会被均值回归(Regression toward the mean)检验并现形。其原因在于,人的表现容易受运气成份影响,导致某个时刻的发挥异常精彩或失常。但时间一长,就会回到正常的表现上去。这也能解释为什么现在上海和一些地方的中考要考察初二开始的月考和期中期末成绩,本质上是为了避免“一锤子买卖”引起的均值回归。
2)可用性(Availability):我们评估事件的概率或某类别发生的频率时,会根据曾经经历过或知道的事情和例子来联想。比如我们会根据在新闻中报道的飞机失事,来判断飞机失事率的高低,而较少考虑飞机与其他交通工具的实际失事比例。又比如,我们会根据周边的同龄人或熟人有心脏病出意外的情况,来评估自己可能得心脏病的风险。这种判断的启发式称为可用性。然而,可用性往往受频率或概率以外的因素影响,如搜索集的有效性、可想象性(imaginability)、错觉相关性(illusory correlation)和示例的可遍历性(retrievability),导致产生预测偏差。
关于搜索集有效性,卡纳曼和特沃斯基曾做过一个实验。他们询问测试者英文字母r或k 在第1个字母还是第3个字母出现的次数更多。多数人回答是前者,因为直觉上更容易想到第1个字母为r或k开始的单词,而要想到第3个出现的单词时,则需要费点脑筋。而实际上作为辅音,r或 k会更多出现在第3个字母上[2,3]。
在可想象性方面,如果评估示例不在记忆中的类别的概率,此时人则需要按某个规则来估计。这种情况下,人会生成多个示例,然后评估其可能性。比如,我们在做商业计划时,会想象可能碰到的各种风险以评估其失败的概率。由于想象的信息并非真实情况,所以会引起偏差。
人也在产生错觉相关性,如对两件共同发生的事情。卡纳曼和特沃斯基曾让几个假装的精神病人画画,然后让测试者根据诊断结果判断他们是否有偏执狂或疑心病,以及判断画的画有没有独特的视角。从测试者判断结果来看,测试者大概率会形成有相关性的判断,如认为疑心病与独特视角之间存在相关性。这称为错觉相关性。其原因是因为之前形成的成对相关性的印象,会导致了随后产生预测偏差。
3)调整和锚定效应(Anchoring Effect):当我们在做决策时,会将某些特定的数值或状态作为起始点,而后的调整会因为此起始点而受限,从而影响到最终的决策方案。其原因在于我们给了最初的信息或起始点,比如给予那些明显的、难忘的证据过多的权重和重视,就容易产生歪曲的认识。比如我们常说的第一印象就是一种锚定效应。《唐逸史》中所说的唐明皇时期,钟馗为终南山人(镇宅赐福圣君)因为相貌丑陋应举不中,羞愧之下触殿阶而死。这是为第一印象所累。正面的锚定效应也有,比如光环效应,一个帅哥和自信的讲者,总能让人听报告时觉得物超所值,当然也更容易被报告忽悠。这还是为第一印象形成的锚定效应所累。
为了证实锚定效应,1974年卡纳曼和特沃斯基曾做了一个有名的实验。他们要求测试者估计非洲国家在联合国的席位百分比。首先,测试者需要旋转一个有0-100数字的罗盘,根据停下来的数字做初始决定。测试者将被告知所选择的数字比实际值大或小,然后测试者可以向上或向下调整估计值。结果,他们发现这些随机选择的数字对最终结果有明显影响。初始值为10和65的两个小组,最终调整的平均值为25和45。由此可见,初始状态设定后,确实会引起锚定效应,限制人解决问题的范围。
因此,深入理解这些启发式规则,有助于改进在不确定情形时人的决策和判断能力。也需要注意,这些不足并不是否定我们人类的直觉能力。正如大部分时间我们都是健康的,但偶尔也会生病。 直觉也是如此,并非一直都是对的。即使统计学家也不见得会是一个好的直觉统计学家。近年的研究表明,除了这些启发式规则外,技能也有助于形成直觉判断和选择,如专家更依赖于其长期的训练获得的经验,而会相对少的依赖启发式规则。有的时候,技能和启发式规则会交替产生影响,促进人们形成快思维方式 [2]。
尽管在很多情况下,直觉都是由个人的偏好如喜欢不喜欢、而不是精细的思考或推理来驱动。但当直觉思维得不到解决方案时,人类会自然转向一种更缜密、需要点努力的慢思维方式,或称之为理性思维阶段。此时,通过漫长学习期获得的知识才会更多地派上用场。
总之,在实际生活中,人类更习惯于快思维,只在困难问题才考虑慢思维,两者经常在无缝地交替使用着,但很少会思考其中的差异和潜在的风险。
既然人类智能体普遍具有快和慢两种思维方式,人类还有独特的顿悟能力。而且顿悟的最终迸发似乎又是一种接近快思维的方式。那么,我们现有的人工智能模型有没可能复制这些机制呢?
如果只考虑预测性能,人工智能模型的“慢”的思维方式在某些领域确实已经占了上风。2017年以来各大人工智能顶会上的论文投稿数量巨增,人脸识别、图像检索领域的识别率已优于人类的能力,这些都可以佐证人工智能在利用复杂模型进行预测的方面有了明显的突破。但是,“快”的思维方式这块则还有明显的差距。
其原因一是缺乏人类学习的可塑性。结果,人工智能模型只能沿着固化的模型结构来完成指定任务。二是缺乏对“不同结构、不同模态的网络之间的联系”的学习。三是未考虑认知错觉或直觉统计学的可借鉴性。
如果以现有的深度学习模型作比拟,也许可以将认知错觉当成一种浅层思维方式。即在深度模型被充分训练和拟合后,在做快速判断时,并不一定需要经过深层次的结构来实现判断。而是像现在深度模型一样,在训练好的浅层区有一个直接联到输出端的跳连接(skip connect)。换个角度来说,如果假定人类构建的模型具有由粗到细的结构,当大脑中枢认为在比如80%的识别率也能保证其正常生存时,就会直接从相对粗糙的浅层位置跳连接到最终的结论输出端,以促进快思维的形成。
另外,要实现顿悟式的学习,也许可以考虑利用不同结构间的相似性。比如AlphaGo下围棋时,就不是完全依赖常规的规则判断,而是创新性地借助了图像处理和计算机视觉的办法来帮助分析围棋棋局的胜负。这从某种意义来看,这是一种跨模态的结构学习。那么,一个自然的问题是,这种结构迥然不同、却面向相同任务的模型之间有没有可能通过自动学习来获得呢?如果可能,也许人工智能体实现顿悟就有希望了。
当然,我们也不能忽视梦可能对顿悟形成的作用。数学家Henri Poincare庞加莱曾说过“作为一种无意识的思考方式,它却能帮助形成突破困境的结果。”
除了顿悟和认知错觉,智能体还有什么感觉也可能以浅层思维或快思维模式为主呢?
参考文献:
1、https://en.wikipedia.org/wiki/Eureka_effect.
2、Kahneman, Daniel. Thinking, Fast and Slow. Farrar, Straus and Giroux, 2011
3、Amos Tversky, Daniel Kahneman. Judgment under Uncertainty: Heuristics and Biases. Science, 185(4157):1124-1131, 1974.
4、Daniel Kahneman; Amos Tversky. Prospect Theory: An Analysis of Decision under Risk Econometrica, Vol. 47, No. 2. (Mar., 1979), pp. 263-292
来源:CAA混合智能专委会
往期文章推荐
🔗【CAC2018】智能 自主 协同 集成,共赴自动化新时代——2018中国自动化大会圆满落幕
🔗【重要通知】中国自动化学会关于2019年度国家科学技术奖提名工作的通知
🔗【重要通知】中国自动化学会关于征集“典赞•2018科普中国” 参评项目的通知
🔗【CAC2018颁奖】中国自动化学会会士荣誉称号授予仪式隆重举行
🔗【CAC2018专题论坛】国际一流学术期刊主编与您面对面论坛成功召开
🔗【CAC2018讨论会】高屋建瓴!8位院士共话“自动化未来”
🔗【学会新闻】中国自动化学会2018年全国秘书长工作会议在西安召开