NSR观点| 学习因果关系和基于因果性的学习

2018 年 1 月 7 日 知社学术圈 国家科学评论

海归学者发起的公益学术平台

分享信息,整合资源

交流学术,偶尔风月


 
 

点击文末“阅读原文”或复制文中链接在浏览器打开可免费下载论文。

 
 


《国家科学评论》(National Science Review,NSR) 最近发表了由美国卡耐基梅隆大学张坤、Peter Spirtes、Clark Glymour和德国马普智能系统研究所Bernhard Schölkopf共同撰写的观点文章“Learning Causality and Causality-Related Learning”(https://doi.org/10.1093/nsr/nwx137),简要阐述了因果性研究的主要进展和目前比较受关注的方向。


人们在日常生活里以及各种科学探索和决策过程中,都常常追问“为什么”这样的因果性问题。为了能干预当前系统从而达到特定的目的,我们需要透过相关性,找到并利用因果性。还有一些问题看似无关“为什么”,但其实答案也存在因果关系中。比如在评价特定人或事的时候,我们往往需要想象在同样的环境中,如果换了一个人或者那件事没有发生,结果又会如何。拿这个假想结果和现实情况对比,人或事所起到的因果效应就显示出来了。按卡尔·荣格的说法,正是对因果关系的在意,催生了现代科学的诞生和发展。目前的因果性研究致力于回答以下问题:通过分析观测的数据,我们能精确地找出数据背后的因果关系吗?如何使人工智能系统理解环境并具备外推能力?如何能在复杂、可变的环境里做最优预测和控制?因果关系有哪些我们还未察觉的用途?

 

《国家科学评论》最近发表了由美国卡耐基梅隆大学张坤、Peter Spirtes、Clark Glymour和德国马普智能系统研究所Bernhard Schölkopf共同撰写的观点文章:Learning Causality and Causality-Related Learning (National Science Review, 2017, https://doi.org/10.1093/nsr/nwx137),简要阐述了该研究领域的一些进展以及目前大家比较关注的方向。找因果关系的传统方法需要做人为干涉或随机实验,这个过程非常昂贵,有时甚至无法做到。因此,人们需要从观测数据中找出因果关系,这个问题统称为因果发现。得益于过去30年数个领域在此问题上的进展,即使没有时间先后信息,现在也有一系列方法能在特定前提下解决这个问题,这也提供了另一个分析“大数据”的途径。在20世纪90年代,学者们发现虽然相关性不直接蕴含因果性,但如果引入一些普遍能接受的假设,就可以从变量的条件独立关系中找到他们之间的因果信息。遗憾的是,这类方法一般不能找出唯一的因果图,而是找到一类图,它们有同样的无向连接,但一些因果方向未必相同。

 

图1 在线性因果关系、非高斯数据分布的情况下,可从数据分布中看出“因”和“果”(特别地,在情况2中,“因”X和噪声是均匀分布的)。


过去10年的研究把这个结果往前推进了一步——假设因果过程服从某些函数模型,那么在一般情况下,反方向是不可能服从这个模型的。具体来说,在反方向,我们是找不到独立的噪声的,这就直接给出了“因”和“果”在统计意义上的不对称性。其中,后非线性因果函数模型(post-nonlinear causal model)在NIPS 2008因果挑战赛中,在所给数据集上都正确区分出了因和果。这个结果改变了一些人的看法——原来单纯从独立同分布的数据中是可以看出谁是因谁是果的。如图1所示,如果因果过程为线性且“因”X和因果过程中的噪声是非高斯的(图中它们是均匀分布的),“因”X和“果”Y具有不对称性。为了实现更鲁棒、实用的因果发现,文中还列出了5个近年来已经引起重视的现实问题,包括:确定性因果关系,如何使用非平稳或异质数据更有效地找到因果关系,以及如何处理非理想数据采集方式带来的观测噪声和数据选择偏差等。

 

文章还探讨了如何从因果关系的角度去理解以及解决某些机器学习问题。大致来说,传统机器学习往往假设数据的分布不变,而目前随着机器学习的广泛应用,我们需要考虑更实际的包含异质数据的问题,比如半监督学习和迁移学习。这类问题的解决可获益于因果系统的性质:首先,我们可以“以不变应万变”——即使数据分布发生变化,因果关系是相对稳定的,因为它对应着实际的物理过程;其次,我们可以“分而治之”——一般来说,因果系统里“因”的产生过程和“因”产生“果”的过程是没有联系的,即使这两个过程都发生了变化,我们也可以把它们各个击破;再次,我们可以“四两拨千斤”——因果过程对应着实际的物理规律,顺着这个过程去构建数据的分布特性往往更简单。目前,该领域的很多研究人员致力于找出更广泛实用、更高效的因果发现方法,以及从因果的角度去开发更具智能的机器学习系统。


文章信息:

Kun Zhang, Bernhard Schölkopf, Peter Spirtes and Clark Glymour

Learning Causality and Causality-Related Learning: Some Recent Progress 

Natl Sci Rev (2017). DOI: 10.1093/nsr/nwx137

https://doi.org/10.1093/nsr/nwx137

扩展阅读

 

NSR观点 | 模型驱动的深度学习

NSR观点 | 深度学习与自然语言处理:优势和挑战

NSR综述 | 甲醇制烯烃反应中SAPO-34分子筛催化剂的最先进合成策略

NSR观点 | 三维拓扑材料的开发:两步法计算筛选策略


媒体转载联系授权请看下方


登录查看更多
17

相关内容

因果关联学习,Causal Relational Learning
专知会员服务
178+阅读 · 2020年4月21日
因果图,Causal Graphs,52页ppt
专知会员服务
238+阅读 · 2020年4月19日
用深度学习揭示数据的因果关系
专知
28+阅读 · 2019年5月18日
AAAI 2019 | 基于分层强化学习的关系抽取
PaperWeekly
20+阅读 · 2019年3月27日
基于统计关系学习的自动数据清洗
FCS
7+阅读 · 2019年3月1日
未来人类会关注可解释性吗?
待字闺中
5+阅读 · 2018年8月9日
【学界】融合对抗学习的因果关系抽取
GAN生成式对抗网络
15+阅读 · 2018年7月14日
NSR专题|机器学习(特邀编辑:周志华)
知社学术圈
7+阅读 · 2018年3月2日
人工智能,机器学习和深度学习之间的差异是什么?
大数据技术
6+阅读 · 2017年11月22日
Dynamic Transfer Learning for Named Entity Recognition
Arxiv
3+阅读 · 2018年12月13日
Arxiv
7+阅读 · 2018年6月19日
Arxiv
8+阅读 · 2018年3月20日
VIP会员
相关VIP内容
因果关联学习,Causal Relational Learning
专知会员服务
178+阅读 · 2020年4月21日
因果图,Causal Graphs,52页ppt
专知会员服务
238+阅读 · 2020年4月19日
相关资讯
用深度学习揭示数据的因果关系
专知
28+阅读 · 2019年5月18日
AAAI 2019 | 基于分层强化学习的关系抽取
PaperWeekly
20+阅读 · 2019年3月27日
基于统计关系学习的自动数据清洗
FCS
7+阅读 · 2019年3月1日
未来人类会关注可解释性吗?
待字闺中
5+阅读 · 2018年8月9日
【学界】融合对抗学习的因果关系抽取
GAN生成式对抗网络
15+阅读 · 2018年7月14日
NSR专题|机器学习(特邀编辑:周志华)
知社学术圈
7+阅读 · 2018年3月2日
人工智能,机器学习和深度学习之间的差异是什么?
大数据技术
6+阅读 · 2017年11月22日
Top
微信扫码咨询专知VIP会员