“贝叶斯网络之父”:通往强人工智能,机器需要因果论 | 赠书

2019 年 7 月 23 日 科研圈

一个多世纪以来,科学家一直信奉“相关关系不等于因果关系”这句统计论断,逐步形成了闭口不谈因果关系的局面。今天,这一禁忌终于被打破了。人工智能领域的权威专家朱迪亚·珀尔及其同事领导的因果革命突破多年的迷雾,厘清了知识的本质,确立了因果关系研究在科学探索中的核心地位。


本文整合自《为什么:关于因果关系的新科学》导读手册

撰文 江生,《为什么》第一译者,华为 2012 泊松实验室主任,机器学习和应用数学首席科学家。


人工智能领域中的大多数问题都是决策问题。我们先来介绍一下决策理论的背景:1939 年,罗马尼亚裔美国统计学家亚伯拉罕·沃德(1902— 1950)撰文指出参数估计和假设检验都是统计决策问题,甚至计划把整个统计学纳入统计决策理论的框架。损失函数是统计决策的起点,它反映了专家知识和特定需求。给定了损失函数,贝叶斯学派将始终如一地选择期望损失最小的决策,有或没有观测数据时都是如此。频率派则需要预先制定决策规则,基于损失函数和样本定义一个风险函数,然后根据某些原则(如极大极小原则、贝叶斯风险原则等)来选择最优的决策。


“观察到某事件”和“使某事件发生”是有本质区别的。如果决策是基于被动接受的观测数据,那么它就处于因果关系之梯的第一层级,强烈地依赖于观测数据,因而难免带有偏颇。而有了第二层级的利器——干预,决策就可以不受观察样本的束缚,把一些样本无法反映的事实揭露出来。这里其实没有什么神秘可言,这些经验或知识早已经写在因果图里了,现在只不过是与数据一起帮助人类或机器更好地做出决策。简而言之,达到第二层级的 AI 将具有主动实施行动来分析因果效应的能力,这种能力使得决策行为更加智能化。


第三层级的反事实推理允许机器拥有“想象能力”。反事实推理考虑的是一个假想世界,其与现实世界完全相悖,是无法通过直接观测数据进行推理的,必须借助一个因果模型。《为什么》一书提到了一个“学历/ 工作经验/ 工资”的因果模型,其中作者的问题,假如爱丽丝为本科毕业,那么她应该拿多少工资——这是一个很好的例子,说明了单靠缺失数据分析无法得出合理的估计。


因果关系之梯


时至今日,深度学习依然是 AI 的热点方法,甚至有人将之盲目地等同于 AI。其实,机器学习只是 AI 的一个领域(它的目标是使计算机能够在没有明确程序指令的情况下从经验或环境中学习),机器学习的方法多如牛毛,深度学习只是沧海一粟。理论上可以证明,人工智能即便在因果关系之梯的最低层级做到极致,也无法跃升到干预层面,更不可能进入反事实的世界。


作为处在因果关系之梯最低层级的机器学习技术,大数据分析和深度学习并不神秘,说得通俗一些,大数据分析就是多变量统计分析,深度学习就是隐层多了一些的神经网络而已,理论上没有太多新意。珀尔教授认为大数据分析和深度学习(甚至多数传统的机器学习)都处于因果关系之梯的第一层级,因为它们的研究对象还是相关关系而非因果关系。


珀尔并没有贬低处于因果关系之梯最低层级的相关性分析,他只是在提醒我们不要满足于这个高度,还要继续向上攀登。不同层级之间也可以形成合作,例如,在实践中,深度学习可用于拟合强化学习中的策略,二者强强联手,成为“深度强化学习”,后者曾作为核心技术之一在 AlphaGo(“阿尔法狗”)那里大放异彩。


《为什么》第一作者、2011 年图灵奖得主朱迪亚·珀尔(Judea Pearl)。

图片来源:samueli.ucla.edu


珀尔的这本科普书来得正是时候。众所周知,这轮 AI 的爆发在很大程度上得益于算力的提升,例如,深度学习就是人工神经网络借助算力的“卷土重来”,把数据驱动的方法推向了一个巅峰。人们甚至产生了一个幻觉 ——“所有科学问题的答案都藏于数据之中,有待巧妙的数据挖掘技巧来揭示”。珀尔教授批判了这种思潮,他将因果模型置于更高的位置,把数学或统计建模的荣耀重新归还给了相应领域的专家。我们希望,未来的机器学习可以不再靠炼金术士的碰运气而获得成功,随着知识推理和计算越发受到关注,可解释 AI 将从关于因果关系的新科学中汲取更多的力量,甚至可以闯进反事实的世界。


2014 年,谷歌公司收购了英国的一家 AI 公司——DeepMind,该公司研发的 AlphaGo 围棋程序在 2016 年首次打败了人类顶尖围棋高手李世石,次年横扫所有人类高手取得全胜(包括以 3∶0 战胜柯洁)。聂卫平(九段)称它的水平为“至少二十段”。AlphaGo 采用深度强化学习和蒙特卡罗树搜索,其最终版本AlphaGo Zero 仅需要 3 天便可自我训练至战胜李世石的水平。2017 年,DeepMind 宣布 AlphaGo“退役”, 不再参加任何围棋比赛。


在棋类游戏中,围棋所包含的巨大的搜索空间(其状态数远远超过整个宇宙中的原子数)一直是机器学习未能攻克的难题,甚至一度被认为在近期内是不可能被 AI 解决的。AlphaGo 的成功不仅让人们看到了强化学习和随机模拟技术(也称“蒙特卡罗”技术)的魅力,也让深度学习变得更加炙手可热。冷静之余,人们认识到 AlphaGo 的算法更适用于大规模概率空间的智能搜索,其环境和状态都是可模拟的。DeepMind 的创始人德米斯·哈萨比斯表示,对于那些环境难以模拟的决策问题(如自动驾驶),这些算法也无能为力。珀尔在《为什么》第十章也谈论了 AlphaGo,他认为缺乏可解释性是它的硬伤。


笔者认为,我们不应该把 AI 技术对立起来,而应该相互取长补短。拿强化学习来说,它不同于有监督学习(supervised learning)和无监督学习(unsupervised learning),是基于马尔科夫决策过程发展起来的第三类机器学习方法——智能体通过与环境互动变得越来越“聪明”。强化学习和因果推断都寻求策略(policy),其中,行动之间是有因果关系的,但因果推断更开放一些,它可以利用数据之外的知识来推断策略的效果。强化学习允许推断干预的结果,因此能攀上因果关系之梯的第二层级。通过模拟环境,强化学习无须从现实世界获取观测数据来训练模型,所以也有可能产生反事实从而登上因果关系之梯的第三层级。尽管目前的强化学习很少用到先验知识,我们仍很好奇强化学习和因果推断的理论联系。


未来人工智能的发展也有“综合”的趋势。譬如,语音、图像、视频数据等都可以转换成文字,而 AI 技术则能帮助我们加深对数据的理解。同时,借助 AI 技术(包括因果推断)更好地理解数据也能助力模型训练并改进应用效果。同理,因果论和现有的机器学习等 AI 技术有没有可能联手互惠互利?例如,因果推断所考虑的变量越多,对计算的挑战就越大,那么,基于蒙特卡罗方法的近似计算是否能其助一臂之力?机器学习能否帮助和改进因果建模?这些问题都有待深入的研究。


因果的形式化理论,不仅解决了困扰统计学家很多年的一些悖论,更重要的是,(1)利用“干预”让人类和机器摆脱了被动观察,从而转向主动地去探索因果关系,以便做出更好的决策;(2)利用“反事实推理”扩展了想象的空间,从而摆脱了现实世界的束缚。这两点突破实现了因果革命,并分别构成了因果关系之梯的第二层级和第三层级的内容。沿着因果关系之梯,机器便有望拥有强人工智能。


珀尔的《为什么》是笔者所知道的目前已出版的唯一一部因果关系科学方面的科普著作,作者在其中深入浅出地把因果关系科学的理论框架及其发展脉络展现给了读者。值得一提的是,那些曾经令人备感困惑的悖论作为经典统计学中的未解之谜,最终也经由因果关系分析而拨云见日,笼罩在其上的迷雾也随之烟消云散了。水落石出后,因果推断显得如此自然, 就仿佛一切本该如此。对于每一位想了解因果关系科学的读者来说,以《为什么》为起点就意味着你踏上了一条捷径,在理解此书的基础上阅读因果关系科学方面的专业著作,你的收获将会更大。


读者福利

你希望人工智能给我们带来什么?


留言分享你的看法,抽取 5 名读者赠送《为什么:关于因果关系的新科学》


作者:朱迪亚·珀尔,达纳·麦肯齐

出版社:中信出版社

(点击“阅读原文”即可购买)


活动规则:在本文评论中留言,点赞数前 5 名的读者每人将获得图书一本。点赞数统计于 7 月 25 日(星期四)下午 17:00 截止。


▽ 精彩回顾 ▽

登录查看更多
3

相关内容

贝叶斯网络是一种概率网络,它是基于概率推理的图形化网络,而贝叶斯公式则是这个概率网络的基础。贝叶斯网络是基于概率推理的数学模型,所谓概率推理就是通过一些变量的信息来获取其他的概率信息的过程,基于概率推理的贝叶斯网络(Bayesian network)是为了解决不定性和不完整性问题而提出的,它对于解决复杂设备不确定性和关联性引起的故障有很大的优势,在多个领域中获得广泛应用。
【2020新书】从Excel中学习数据挖掘,223页pdf
专知会员服务
92+阅读 · 2020年6月28日
【新书册】贝叶斯神经网络,41页pdf
专知会员服务
179+阅读 · 2020年6月3日
【经典书】贝叶斯编程,378页pdf,Bayesian Programming
专知会员服务
250+阅读 · 2020年5月18日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
197+阅读 · 2020年3月8日
人工智能学习笔记,247页pdf
专知会员服务
185+阅读 · 2019年12月14日
【机器学习课程】机器学习中的常识性问题
专知会员服务
75+阅读 · 2019年12月2日
一文读懂机器学习中的贝叶斯统计学
数据分析
26+阅读 · 2019年5月8日
王维嘉:暗知识——机器认知的颠覆
亚布力中国企业家论坛
5+阅读 · 2019年3月12日
【人工智能】人工智能的应用边界
产业智能官
4+阅读 · 2018年1月9日
人工智能的阴暗面
计算机与网络安全
6+阅读 · 2018年1月8日
数学不好能搞人工智能吗?
算法与数学之美
3+阅读 · 2017年11月27日
贝叶斯网络入门
论智
15+阅读 · 2017年11月19日
如何在Chatbot中应用深度学习? | 赠书
人工智能头条
5+阅读 · 2017年9月12日
Arxiv
24+阅读 · 2019年11月24日
Teacher-Student Training for Robust Tacotron-based TTS
Arxiv
6+阅读 · 2019年7月11日
Hierarchical Deep Multiagent Reinforcement Learning
Arxiv
8+阅读 · 2018年9月25日
Arxiv
26+阅读 · 2018年9月21日
VIP会员
相关VIP内容
【2020新书】从Excel中学习数据挖掘,223页pdf
专知会员服务
92+阅读 · 2020年6月28日
【新书册】贝叶斯神经网络,41页pdf
专知会员服务
179+阅读 · 2020年6月3日
【经典书】贝叶斯编程,378页pdf,Bayesian Programming
专知会员服务
250+阅读 · 2020年5月18日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
197+阅读 · 2020年3月8日
人工智能学习笔记,247页pdf
专知会员服务
185+阅读 · 2019年12月14日
【机器学习课程】机器学习中的常识性问题
专知会员服务
75+阅读 · 2019年12月2日
相关资讯
一文读懂机器学习中的贝叶斯统计学
数据分析
26+阅读 · 2019年5月8日
王维嘉:暗知识——机器认知的颠覆
亚布力中国企业家论坛
5+阅读 · 2019年3月12日
【人工智能】人工智能的应用边界
产业智能官
4+阅读 · 2018年1月9日
人工智能的阴暗面
计算机与网络安全
6+阅读 · 2018年1月8日
数学不好能搞人工智能吗?
算法与数学之美
3+阅读 · 2017年11月27日
贝叶斯网络入门
论智
15+阅读 · 2017年11月19日
如何在Chatbot中应用深度学习? | 赠书
人工智能头条
5+阅读 · 2017年9月12日
相关论文
Top
微信扫码咨询专知VIP会员