过去两年我在硅谷做人工智能方面的投资,同时对那些基础的东西非常有兴趣。
我发现了一个重要的东西叫“暗知识”,“暗知识”就是人类无法理解的知识。什么叫人类无法理解的知识?这还要从阿尔法狗下围棋开始说起。阿尔法狗下围棋,让全世界第一次注意到人工智能的神奇。柯洁在下完棋后痛哭流涕,说我根本不可能打过他。它也让聂卫平五体投地,说阿尔法狗至少是20段。正当我们被阿尔法狗一棒子打晕的时候,他的妹妹又出现了,他的妹妹就是“阿尔法折叠”。2018年年底,谷歌在科学杂志上发布了“阿尔法折叠”的研究成果,它可以根据DNA的序列测出一个蛋白质的三维结构。
大家知道,蛋白质是一个超级大的分子,它的三维结构决定了蛋白质的性质,所有的生物、人体、植物动物的细胞都由蛋白质组成。人类今天对蛋白质的理解还是非常浅的。
2017年的诺贝尔化学奖颁给了冷冻电镜的发明者Richard Henderson,冷冻电镜是干什么的呢?用来看蛋白质的三维结构。过去人类不知道,也无法看到蛋白质的三维结构,现在有了冷冻电镜,我们终于可以看到蛋白质的三维结构。怎么看呢?要把细胞冷冻了以后,照几十万张照片才能画出一个蛋白质的三维结构。所以,只要看清楚一个蛋白质的三维结构,那就是顶级期刊的一篇文章。
阿法蝶(叠)从基因序列准确预测蛋白质结构
那么一台冷冻电镜多少钱呢?一千万美金。我们去耶鲁,耶鲁人非常骄傲:我们有一台电镜。清华有两台。但是今天,“阿尔法折叠”只用人工智能就可以把它猜出来。怎么猜出来的?不知道。这就带来了一个巨大的问题:阿尔法狗下围棋,谷歌的工程师并不知道他怎么下,聂卫平也不知道。人工智能里出现了一个巨大的问题,就是不可解释性。
我们人类从来没有这样憋屈过,因为我们自以为是整个宇宙智能最高的生物,没有任何事情是我们不可理解的,所有的事情都应该有因果。可是为什么到了今天,我们居然不能理解?这就让我们回到人类是如何获取知识的这个问题。
过去两千年来,一直有两派在激烈地争论。一派是理性主义。他们认为,概念是天生就有的,知识来自于推理,万事万物都有因果。这派的代表有柏拉图,一直到笛卡尔。另外一派是从亚里士多德到苏格兰学派,他们认为人生出来天生是白纸一张,知识来自于感官,来自于经验,万世万物没有什么因果,只是相关。我们中国人更倾向于哪一派呢?经验主义。中国人觉得,所有的经验不通过感受和感官怎么能得到呢?
经验主义的一个重要的方法论叫“归纳”。我见到一只天鹅是白的,两只天鹅是白的……第一万只天鹅是白的,那么我就得出结论——天鹅是白的,直到出现了第一只黑天鹅。所以,归纳法也是错的,是不可靠的。
为什么这两派争了两千年,谁都不服谁?原因是他们在瞎争,因为他们都不理解人类学习的微观机制是什么样的。人类学习的微观机制一直到70年前才开始被搞清,它就基于大脑神经元的连接。人类有860亿个神经元。
这个学习机制是怎么发现的?我们要归功于巴甫洛夫。他发现,给狗喂食的时候摇铃,一旦形成了习惯,即使没有食物,一摇铃狗也会流口水。这就是条件反射。1949年,加拿大科学家赫布就如何解释这个现象提出了一个猜想:同时受激发的两个神经元会连接起来。比如,嗅觉细胞闻到了狗食的香味,同时听觉细胞听到了铃声,这两个细胞是同时受刺激的,一旦同时受刺激,它俩就连起来了,在连接的地方就形成了学习。下一回当你只听到铃声,这个细胞就被激活,就会刺激“口水”细胞。这一猜想后来被无数的科学实验证明是对的,被称为“赫布学习定律”。
人类所有的学习都是这样的一个微观机制。再微观下去,每个神经有上千个突触,每个突触之间是有电流通过的,所谓神经元之间的连接,实际是离子变成了电流,然后建立了神经元之间的传导,其中的间隙只有20纳米。知道了学习的微观机制,我们就可以回过头来看人类的知识是怎么获得的。
我们今天理解的知识叫“明知识”,就是可以用文字、公式、程序、语言表达出来的知识。直到70年前,波兰尼、哈耶克发现了一种知识叫“默知识”,或者叫“默会知识”。比如学自行车,全世界没有一个人骑自行车是看手册学会的,都是骑上去歪歪扭扭摔几跤学会的。你教孩子学自行车,其实你也不知道是怎么学的。这种知识在生活中大量存在,比如绘画、舞蹈和拉提琴等等都是这样的默会知识。默会知识的基本原理就是:大脑神经元建立了联系,但这样的联系非常复杂,是无法用语言表达的。我们所有的重大决定,最后都是由老板拍板。老板怎么拍板?索罗斯说,“我所有的重大决定都是靠胃做出来的,如果我的胃疼,说明这个决定不好。”
哈耶克在默知识的基础上发展出了一整套体系,他说:“因为默知识不可表达,所以不可记录,所以不可集中,所以计划经济不可行。”也就是说,哈耶课从哲学上、从认识论上证明了计划经济根本就是不可行的。
比如说,乔布斯从来不做市场调查,他说,“我的市场调查,就是每天早上出门前对着镜子看我自己。”为什么?当智能手机出来之前,你去做用户调查,问:你认为一个智能手机是什么样的?你想要什么样的智能手机?全世界没有一个人说得出来,这就是默知识,我们冥冥中知道要什么东西,但是说不出来。那怎么办?只能靠企业家去试错,在乔布斯成功之前,硅谷试了20年,从掌上电脑到不成功的手机和触屏,出现了各种各样的东西,有不知道多少家公司失败,最后到乔布斯成功。所以,因为默知识不可集中,所以创新必须是分散的,永远不可集中。
讲完了明知识和默知识,我们现在就可以讲机器发现的暗知识。什么叫暗知识?就是人类不可感受又不可表达的一类新知识。我们如果划一个坐标轴,横轴是可表达,纵轴是可感受,那我们会发现,人类已有的知识都在右边,有浮力定律等即可感受、也可表达的明知识;还有集合论、广义相对论、量子力学等可表达而不可感受的明知识,它们是从方程里推出来的,是先有数学而后才有的物理发现。默知识是不可表达,但是可感受。这四个象限正好缺了第四象限,就是既不可表达又不可感受,这就是今天机器发现的这类知识,也就是阿尔法狗下围棋、“阿尔法折叠”算蛋白质三维结构的这类知识。
如果用一个冰山来表达的话,人类已知的明知识,就是冰山的一小角,暗知识是冰山下面的最大块的东西。波兰尼,也就是第一个发现默知识的奥匈科学家,说:“我们知道的比我们说出来的要多。”但是暗知识就是整个海洋,也就是说,未来机器发现的知识会让我们人类已有的两千年到今天为止的知识显得微不足道。我们人类以为,我们已经可上九天揽月,可以做基因编辑,但是实际上是什么也没有。暗知识是未来统治和占领整个知识空间的最大量的一种知识。
大家说,你说的“暗知识”是不是一种哲学概念,这跟我有什么关系?太有关系了。上海交通大学两位教授用1800张照片来训练机器,照片中有罪犯、有好人,最后机器可以以90%的准确率来判断是否是罪犯。这项研究在国际上引起了巨大的争议。我到以色列看一家公司,他们也说在做同样的东西,而且以色列海关准备用于查恐怖分子。我最终没有投这家公司,因为我感觉这东西太悬乎了,但是有可能机器的确比人看得准。为什么?不知道,我看你就像罪犯!
社会积分系统。如果说今天摄象头布满了所有地方,那每个人从早上起来,从小到大所有的行为都在摄象头下,最后摄象头就根据你的行为,给你算出社会积分。你说我表现这么好,凭什么打这么低的分?不知道。这就是未来我们将遇到的重大问题,不可解释的问题。
再如诺曼底登陆,为什么在诺曼底而不是卡拉斯登陆?机器算出来说要在卡拉斯登陆,那么盟军司令听不听?听它的可能就打胜仗,不听它的就打败仗。但是我们根本不懂为什么要这样做?未来一个重大的决定很可能就是由机器做出来的,你可以选择不听机器的,但是你会失败。但是为什么呢?不知道。因为是暗知识。这些生死攸关的决定,到底敢不敢交给机器来做?
所以,人类历史上第一次被一脚踢出了知识获取的回路。过去所谓知识就是人去学东西,现在机器自己学,和我们人没有什么关系了,我们人一边儿凉快去了,我们成了“吃瓜群众“了。
因此,我们正面临着一个新时代的到来,它不仅仅是AI技术的改进,而且从哲学、从认识论上给我们提出了根本的挑战,也就是说,机器认知时代到来。这个时代无所不在的传感器在记录着所有的物理量——温度,气温,每个人的活动,血液、心脏的跳动……然后将这些数据通过5G网络传到云端,机器再把万世万物当中隐蔽的相关性找出,并凭借相关性去做事,去改进我们生活或者是破坏我们的生活,去优化生产或者进行互相残杀。
现在的问题是,我们人类无法理解“暗知识”,而且我们人类越来越渺小,我们人类的知识现在刚刚开始,未来的机器知识会越来越多,我们人类就像最后几个小岛,被暗知识这个海洋所淹没。那么,我们就面临一个重大的问题——人类和机器的关系。谁听谁的?事实上,我们等于在无意中给自己创造了一个上帝,这样一个时代的到来,会产生什么样的问题?会怎样颠覆我们每个行业?会不会突然造成大规模的失业?未来的社会、政治、军事战争会是什么形态?这些都会受到暗知识的影响。我过去两年每天晚上都研究这个问题,2019年4月中信出版社会出版我的书《暗知识》。大家如果有兴趣,将来可以看这本书。谢谢大家!