【观点】复旦大学张军平——爱犯错的智能体(一):视觉倒像

2018 年 6 月 28 日 中国自动化学会

机器会犯错,其错要么是因为数据集太少,无法涵盖数据形成的样本空间;要么是由于训练太过精细,导致没办法对新来的样本或数据形成有效预计,俗称为过拟合;要么是模型本身的能力低,结果对样本的刻画能力不足;要么是硬件条件受限,无法完全相关任务。不管哪种错,总是多少能找到原因的。

而智能体尤其是人类的犯错,却有很多缺乏明晰的解释。人类会在很多方面犯错,产生错误的判断,视觉上、听觉上、距离上、认知上、情绪上,甚至人类发育的基础,基因上,都有。为什么这样一种错误频出的智能体,却能凌驾于其他生命成为地球的主宰呢?这些犯错到底有什么用呢?了解这些犯错,说不定能从中找出一些有用的线索,来重新思考人工智能的发展方向。

今天聊聊人类在视觉上的犯错表现。这种犯错常被称为光学错觉,英文叫Optical illusion。

先从光学成像说起吧,第一个还没得到完全认识、但却又是最基本的,是视觉倒像问题。小孔成像原理告诉我们,要观测的目标通过瞳孔的凸透镜原理映射至视网膜上,是一个标准的倒像。如果是机器,则可以通过光学变换还原成正常的影像。而智能体似乎并没有光学变换的能力,从视网膜往后联就是视神经元了。人类的视网膜上位于中间位置(俗称中央凹,fovea)的视锥神经和周边的视杆神经主要承担感受光强、颜色和运动状态的功能,似乎没有自动翻转的能力。

图1:眼睛的小孔成像原理

假如没有自动翻转成正常或倒着看世界会如何呢?金庸的书籍《射雕英雄传》谈到过。西毒欧阳锋为了学习从黄蓉那弄来的、假的《九阴真经》,将全身经脉逆转,结果走火入魔,变成手当足、脚当手来倒立走路。经过一段时间后,他似乎已经习惯这种颠倒的世界。

当然,这是小说中的虚构。但从历史来看,还真有科学家做过这样的尝试。1897年,美国心理学家George Stratton发表了“视网膜没有逆转视觉”的论文。在论文中,他详细介绍了关于视网膜倒像的实验。他给自己戴了一幅凸透镜,并把其中一只眼完全遮住。在前四天,本已被凸透镜纠正过来的正像,他看到的却始终是倒的。结果,以平时经验去拿东西都很失败和别扭。因为影像是倒过来的,而手势什么却还是按正常的方向去行动,想拿地上的物品手会往上伸,想拿架子上的手却往下放。不过到第五天后,他的视觉奇怪地、自发地变成正像了,好象视觉神经已经适应了,他肢体的动作也与再次世界协调了。但再取掉凸透镜后,他发现世界竟然都是巅倒的,之前的正像要再过一段时间才能恢复。换一只眼执行此实验,情况依旧。因此,他断定人的视网膜并没有把倒像颠倒过来,其功能是在视觉神经的后端实现的。即,视网膜感受的颠倒信号,是在通过视神经传导到大脑皮层的视觉中枢后,在视觉中枢实现自动翻转的。这也是目前学术界的共识。

 

图2  视觉倒像实验[Wiki]

其实还有个简单的办法可以检验视觉在视网膜位置是倒像的。你读到这里的时候,不妨把手放到下眼皮底下,用手把下眼皮慢慢往上推。你应该能看到一整块模糊掉的字和图往下走,而不是往上。视觉能力强的,说不定在下眼皮遮挡眼睛的过程中,看到上方会出现一块黑斑。这些恰恰就是因为光学视觉倒像造成的。

后期有很多科学家想重复他的实验,不过比较遗憾地是,没有人观察到过倒像还能适应后翻转的现象,更多地是表示能够适应巅倒过来的世界。

不过也有科学家在尝试中发现,如果戴那种会导致变形的眼镜时,类似哈哈镜那种,有些人的视觉会自动将一些没注意到的变形的位置纠正。而取下眼镜后,看到的世界反而变得扭曲了。这似乎表明大脑确实能自适应地纠正一些扭曲。

现实生活中,也有一些人会故意去阅读一些倒过来的书本,他们将其视为提高阅读速度和能力的一种秘技。还有科学家说,通过这种方式,可以刺激大脑形成新细胞,防止衰老。其实大家稍微练练,也不难做到。所以,以后看到倒着看报纸、读书的人或新闻照片时,不要马上就嘲笑喔,说不定他们真的能这样读的,哈哈。

图3  大师辜鸿铭”把报纸倒过来读”的轶事【摘自2018年1月《博爱》】

另外,作为感官元件,眼睛和其它感觉器官还有点不一样。它是在大脑发育过程中,从大脑细胞中分裂出来的。如果把从眼球到视觉中枢的连接看成是一个深度学习模型,也许可以将这种视频倒像的纠正,理解为大脑处理的端到端表现。

但倒像纠正具体是何时发生的,George Stratton没有给出研究结论。现有的文献也是说法不一。有说初生儿开始感知的世界是颠倒的,随着大脑发育的逐步完善而慢慢实现的。因为有报道说,有些两三岁的小孩可能喜欢会倒拿玩具,倒读连环画的,并猜测这可能和正视发育未完全有关。还有些人,据说天生就有空间定向现象(spatialorientation phenomenon),看的世界都是颠倒的。也有说倒视能力是与生俱来的,毕竟前者的例子还是很鲜见。

图4  患有“空间定向障碍”的塞尔维亚女子,眼中世界完全颠倒

不管怎么说,这个看似极其简单的问题,仍然没有找到统一圆满的答案,不论是它的成因还是发生时间上。

张军平

2018年6月24日于湖南省湘潭市

来源:混合智能专委会

往期文章推荐

人工智能名人堂第49期 | 斯坦福研究院名人堂成员:Peter E. Ha

🔗【通知】2018智能汽车跨界融合高峰论坛会议通知

🔗【通知】中国自动化学会关于推荐联合国 可持续发展目标青年工程师奖项候选人的通知

🔗【分支机构】中国自动化学会区块链专业委员会正式成立

🔗【通知】2018全国第二十三届 自动化应用技术学术交流会会议通知

🔗【CAC2018】2018中国自动化大会论文投稿截止日期变更通知

🔗【CAA】第一届“军事大数据论坛”邀请函

🔗 【IV18】阔别十年,智能车世界一流会议回归中国

🔗【通知】关于2018年度CAA科学技术奖励推荐工作的通知

🔗【重要通知】“第一届军事大数据论坛”征文

🔗【学会新闻】第29届IEEE国际智能车大会在常熟正式拉开帷幕

登录查看更多
0

相关内容

张军平,复旦大学 复旦大学计算机科学技术学院教授、博士生导师。主要研究方向是人工智能、机器学习、图像/音乐处理、生物认证及智能交通。目前主持科技部项目一项和国家自然基金面上项目一项。他为人工智能著名期刊IEEEIntelligentSystems编委,为国内权威期刊《软件学报》、《自动化学报》、《模式识别与人工智能》等责任编辑。他是中国自动化学会混合智能专业委员会副主任,中国人工智能学会机器学习专委会常委。张军平教授发表近100篇高质量论文。个人主页:http://www.pami.fudan.edu.cn/~jpzhang/
【ICML2020-哈佛】深度语言表示中可分流形
专知会员服务
12+阅读 · 2020年6月2日
基于视觉的三维重建关键技术研究综述
专知会员服务
160+阅读 · 2020年5月1日
【Uber AI新论文】持续元学习,Learning to Continually Learn
专知会员服务
36+阅读 · 2020年2月27日
清华大学两名博士生被开除:你不吃学习的苦,就要吃生活的苦
机器学习算法与Python学习
25+阅读 · 2019年9月16日
王维嘉:暗知识——机器认知的颠覆
亚布力中国企业家论坛
5+阅读 · 2019年3月12日
浅谈外泌体抑制剂——鞘磷脂酶抑制剂GW4869
外泌体之家
8+阅读 · 2018年12月19日
【泡泡图灵智库】密集相关的自监督视觉描述学习(RAL)
泡泡机器人SLAM
11+阅读 · 2018年10月6日
李飞飞:让机器有分辨事物的“眼睛”
人工智能学家
3+阅读 · 2018年4月13日
CCCF专栏:李航 | 人工智能的未来 ——记忆、知识、语言
中国计算机学会
7+阅读 · 2018年3月16日
Generating Rationales in Visual Question Answering
Arxiv
5+阅读 · 2020年4月4日
Multi-task Deep Reinforcement Learning with PopArt
Arxiv
4+阅读 · 2018年9月12日
Viewpoint Estimation-Insights & Model
Arxiv
3+阅读 · 2018年7月3日
Arxiv
7+阅读 · 2018年2月26日
VIP会员
相关资讯
清华大学两名博士生被开除:你不吃学习的苦,就要吃生活的苦
机器学习算法与Python学习
25+阅读 · 2019年9月16日
王维嘉:暗知识——机器认知的颠覆
亚布力中国企业家论坛
5+阅读 · 2019年3月12日
浅谈外泌体抑制剂——鞘磷脂酶抑制剂GW4869
外泌体之家
8+阅读 · 2018年12月19日
【泡泡图灵智库】密集相关的自监督视觉描述学习(RAL)
泡泡机器人SLAM
11+阅读 · 2018年10月6日
李飞飞:让机器有分辨事物的“眼睛”
人工智能学家
3+阅读 · 2018年4月13日
CCCF专栏:李航 | 人工智能的未来 ——记忆、知识、语言
中国计算机学会
7+阅读 · 2018年3月16日
Top
微信扫码咨询专知VIP会员