本期内容为《走进人工智能》:第9讲 公鸡打鸣与太阳升起:非因非果
《走进人工智能》
公鸡打鸣与太阳升起:非因非果
因果和关联是两个经常会被混淆的概念。比如说,公鸡打鸣和太阳升起之间不具有因果关系,只具有关联关系。我们知道,公鸡一打鸣,太阳就会升起。但是,公鸡打鸣不是太阳升起的原因。因为即使世界上没有公鸡这种动物,太阳依旧会像在恐龙时代一样,每天照常升起。
与关联关系强调若干事物共同发生不同,因果关系强调“因”和“果”之间应该具有“引起”和“被引起”的关系,如《墨经》所言“力,形之所以奋也”,这里力就是人和物体产生运动的原因,因此力和运动之间存在因果关系。
图灵奖获得者朱迪亚·珀尔(Judea Pearl)把因果研究从易到难,分为三个主要层级,分别是从观测现象中挖掘数据之间的关联、对观测结果进行干预后做出决策以及对已经发生结果进行否定的反事实推理。
在大数据涌现时代,大数据思维正将科学研究从“设计什么样的实验来验证这个假设?”转变为“从已知数据中能看到什么相关性?”。典型例子如下:谷歌公司通过互联网用户的搜索词条来预测现实世界中流感疾病的爆发趋势,在搜索词条和流感爆发之间建立关联;电商从消费数据中给用户建立画像,在用户和商品之间建立消费偏好的关联;以及商品价格与销售量之间的关联、吸烟频率与患癌症之间的关联等等。
19世纪,生物学家达尔文(Charles Robert Darwin)的表弟弗朗西斯·高尔顿 (Francis Galton)发表了题为《遗传身高向平均数方向回归》(Regression towards mediocrity in hereditary stature)的论文,论文对所收集的930个成年子女以及对应的205对父母的身高进行了分析,发现了一个很有趣的“向均值回归(regression)”现象:父母身材高大,孩子往往身材高大,但又略矮于父母;父母身材矮小,孩子往往身材矮小,但又略高于父母。大自然具有一种约束力,使人类身高分布相对稳定地处于均值附近而不产生两极分化。高尔顿在父母身高和子女身高之间建立了一种被称为“回归”的关联关系,并把这种关系用一个“相关系数”来表示。现实生活中很多现象是多种原因以复杂方式混合在一起的,相关性就是一种描述关联的有效方法。基于相关性的回归分析是科学思想的巨大突破,它从观测现象出发,用数学模型建立不同事物之间的关联。后来,卡尔·皮尔逊(Karl Pearson)在高尔顿的基础上完善了相关性这一概念,于1911年在伦敦大学学院(University College London)创立了世界上第一个统计学专业。
产品名称:走进人工智能∣有声通识十五讲
主理人:吴飞
出品机构:高等教育出版社 、高等教育电子音像出版社
合作机构:浙江大学上海高等研究院、上海人工智能实验室智能教育中心
出品时间:2022年1月