【观点】复旦大学张军平——爱犯错的智能体（一）：视觉倒像

2018 年 6 月 28 日 中国自动化学会

机器会犯错，其错要么是因为数据集太少，无法涵盖数据形成的样本空间；要么是由于训练太过精细，导致没办法对新来的样本或数据形成有效预计，俗称为过拟合；要么是模型本身的能力低，结果对样本的刻画能力不足；要么是硬件条件受限，无法完全相关任务。不管哪种错，总是多少能找到原因的。

而智能体尤其是人类的犯错，却有很多缺乏明晰的解释。人类会在很多方面犯错，产生错误的判断，视觉上、听觉上、距离上、认知上、情绪上，甚至人类发育的基础，基因上，都有。为什么这样一种错误频出的智能体，却能凌驾于其他生命成为地球的主宰呢？这些犯错到底有什么用呢？了解这些犯错，说不定能从中找出一些有用的线索，来重新思考人工智能的发展方向。

今天聊聊人类在视觉上的犯错表现。这种犯错常被称为光学错觉，英文叫Optical illusion。

先从光学成像说起吧，第一个还没得到完全认识、但却又是最基本的，是视觉倒像问题。小孔成像原理告诉我们，要观测的目标通过瞳孔的凸透镜原理映射至视网膜上，是一个标准的倒像。如果是机器，则可以通过光学变换还原成正常的影像。而智能体似乎并没有光学变换的能力，从视网膜往后联就是视神经元了。人类的视网膜上位于中间位置（俗称中央凹，fovea）的视锥神经和周边的视杆神经主要承担感受光强、颜色和运动状态的功能，似乎没有自动翻转的能力。

图1：眼睛的小孔成像原理

假如没有自动翻转成正常或倒着看世界会如何呢？金庸的书籍《射雕英雄传》谈到过。西毒欧阳锋为了学习从黄蓉那弄来的、假的《九阴真经》，将全身经脉逆转，结果走火入魔，变成手当足、脚当手来倒立走路。经过一段时间后，他似乎已经习惯这种颠倒的世界。

当然，这是小说中的虚构。但从历史来看，还真有科学家做过这样的尝试。1897年，美国心理学家George Stratton发表了“视网膜没有逆转视觉”的论文。在论文中，他详细介绍了关于视网膜倒像的实验。他给自己戴了一幅凸透镜，并把其中一只眼完全遮住。在前四天，本已被凸透镜纠正过来的正像，他看到的却始终是倒的。结果，以平时经验去拿东西都很失败和别扭。因为影像是倒过来的，而手势什么却还是按正常的方向去行动，想拿地上的物品手会往上伸，想拿架子上的手却往下放。不过到第五天后，他的视觉奇怪地、自发地变成正像了，好象视觉神经已经适应了，他肢体的动作也与再次世界协调了。但再取掉凸透镜后，他发现世界竟然都是巅倒的，之前的正像要再过一段时间才能恢复。换一只眼执行此实验，情况依旧。因此，他断定人的视网膜并没有把倒像颠倒过来，其功能是在视觉神经的后端实现的。即，视网膜感受的颠倒信号，是在通过视神经传导到大脑皮层的视觉中枢后，在视觉中枢实现自动翻转的。这也是目前学术界的共识。

■ ■ ■ ■ ■

图2 视觉倒像实验[Wiki]

其实还有个简单的办法可以检验视觉在视网膜位置是倒像的。你读到这里的时候，不妨把手放到下眼皮底下，用手把下眼皮慢慢往上推。你应该能看到一整块模糊掉的字和图往下走，而不是往上。视觉能力强的，说不定在下眼皮遮挡眼睛的过程中，看到上方会出现一块黑斑。这些恰恰就是因为光学视觉倒像造成的。

后期有很多科学家想重复他的实验，不过比较遗憾地是，没有人观察到过倒像还能适应后翻转的现象，更多地是表示能够适应巅倒过来的世界。

不过也有科学家在尝试中发现，如果戴那种会导致变形的眼镜时，类似哈哈镜那种，有些人的视觉会自动将一些没注意到的变形的位置纠正。而取下眼镜后，看到的世界反而变得扭曲了。这似乎表明大脑确实能自适应地纠正一些扭曲。

现实生活中，也有一些人会故意去阅读一些倒过来的书本，他们将其视为提高阅读速度和能力的一种秘技。还有科学家说，通过这种方式，可以刺激大脑形成新细胞，防止衰老。其实大家稍微练练，也不难做到。所以，以后看到倒着看报纸、读书的人或新闻照片时，不要马上就嘲笑喔，说不定他们真的能这样读的，哈哈。

图3 大师辜鸿铭”把报纸倒过来读”的轶事【摘自2018年1月《博爱》】

另外，作为感官元件，眼睛和其它感觉器官还有点不一样。它是在大脑发育过程中，从大脑细胞中分裂出来的。如果把从眼球到视觉中枢的连接看成是一个深度学习模型，也许可以将这种视频倒像的纠正，理解为大脑处理的端到端表现。

但倒像纠正具体是何时发生的，George Stratton没有给出研究结论。现有的文献也是说法不一。有说初生儿开始感知的世界是颠倒的，随着大脑发育的逐步完善而慢慢实现的。因为有报道说，有些两三岁的小孩可能喜欢会倒拿玩具，倒读连环画的，并猜测这可能和正视发育未完全有关。还有些人，据说天生就有空间定向现象(spatialorientation phenomenon)，看的世界都是颠倒的。也有说倒视能力是与生俱来的，毕竟前者的例子还是很鲜见。

图4 患有“空间定向障碍”的塞尔维亚女子，眼中世界完全颠倒

不管怎么说，这个看似极其简单的问题，仍然没有找到统一圆满的答案，不论是它的成因还是发生时间上。

张军平

2018年6月24日于湖南省湘潭市

来源：混合智能专委会

往期文章推荐

人工智能名人堂第49期 | 斯坦福研究院名人堂成员：Peter E. Ha

🔗【通知】2018智能汽车跨界融合高峰论坛会议通知

🔗【通知】中国自动化学会关于推荐联合国可持续发展目标青年工程师奖项候选人的通知

🔗【分支机构】中国自动化学会区块链专业委员会正式成立

🔗【通知】2018全国第二十三届自动化应用技术学术交流会会议通知

🔗【CAC2018】2018中国自动化大会论文投稿截止日期变更通知

🔗【CAA】第一届“军事大数据论坛”邀请函

🔗 【IV18】阔别十年，智能车世界一流会议回归中国

🔗【通知】关于2018年度CAA科学技术奖励推荐工作的通知

🔗【重要通知】“第一届军事大数据论坛”征文

🔗【学会新闻】第29届IEEE国际智能车大会在常熟正式拉开帷幕

登录查看更多

相关内容

张军平

关注 0

张军平，复旦大学复旦大学计算机科学技术学院教授、博士生导师。主要研究方向是人工智能、机器学习、图像/音乐处理、生物认证及智能交通。目前主持科技部项目一项和国家自然基金面上项目一项。他为人工智能著名期刊IEEEIntelligentSystems编委，为国内权威期刊《软件学报》、《自动化学报》、《模式识别与人工智能》等责任编辑。他是中国自动化学会混合智能专业委员会副主任，中国人工智能学会机器学习专委会常委。张军平教授发表近100篇高质量论文。个人主页：http://www.pami.fudan.edu.cn/~jpzhang/

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

专知会员服务

81+阅读 · 2020年7月2日

【ICML2020-哈佛】深度语言表示中可分流形

专知会员服务

13+阅读 · 2020年6月2日

基于视觉的三维重建关键技术研究综述

专知会员服务

166+阅读 · 2020年5月1日

【CVPR2020-Facebook AI】扩展架构的高效视频识别，X3D: Expanding Architectures

专知会员服务

22+阅读 · 2020年4月11日