从默默无闻到无所不能,统计学如何“逆袭”?

2018 年 7 月 12 日 罗辑思维

如果评选出版史上最容易因书名引起误会的书,这本书要是第二,没书敢称第一。

它就是今天要介绍的——《女士品茶》,一本统计学名著。

作者:  萨尔斯伯格 

译者:邱东 等 

出版:中国统计出版社


1. 你可能会好奇:一本统计学名著,为啥书名要用“女士品茶”呢?这背后有个故事。剑桥大学的一群教授喝下午茶时,一位女士说:“把茶倒进牛奶,和把牛奶倒进茶里,调出来的茶味道不同。”为了验证是否如此,这群科学家专门设计了个实验。

假设“口味不变”,只改变茶和牛奶的加入顺序,重复试验……从预设结论,到控制变量、重复实验过程,再到分析数据、验证预设。这个流程,包含标准的统计学思路。


2. 如今,统计学被应用在方方面面。为啥公司要设法获取用户数据?为啥浏览信息后会收到各种“猜你喜欢”?为啥天气预报有时会不准…… 所有这些事的背后,都有一只“统计学之手”。

统计学就是通过收集、分析、解读数据,解决现实问题。数据是统计学的“灵魂”。


3. 统计学史上第一次高光时刻——美国经济大萧条。

20世纪30年代,美国经历经济大萧条。国家情况到底有多糟,没人知道。为了更好地决策,美国政府使用随机抽样的方式,来更准确地了解国家的情况。在政府推动下,抽样调查迅速被应用到其他领域。


4. 统计学史上第二次高光时刻——二战。

“二战”时,统计学在密码破译领域功勋卓著。用统计学破解密码,利用了建模思想。常用方法是:统计加密信息中每个字符出现的频率,把它和实际使用中,不同字母出现的频率作对比,就能猜到它对应的字母。

美国就是利用统计字母频率的方式,破解了日军进攻中途岛的消息,一举扭转战局。


5. 上面两次大规模的“实战”,证明了统计学的价值。统计学中至关重要的两个工具——抽样调查、统计建模,在这两次高光时刻里,被完善和固定下来。统计学从默默无闻的小学科,成为科学研究的基础工具。


6. 在众多学科中,统计学还有一个特殊地位——见证了人类一次重要的认识升级。

之前人们相信“有因必有果,有果必有因”。随着科学发展,人们认识到:世间万物并非是绝对的因果关系,很多结果是随机的。

这个转变的重要标志,就是统计学的兴起:从简单记录数据,变为研究数据出现的概率、分析相关性。统计学逐渐受到重视。


7. 你思考过这个问题没有:人类认识世界,始终存在一个矛盾——世间万物无限,但我们掌握的数据却很有限。这是否意味着人类无法认识世界了?

不。统计学,能解决这个问题。从总体中挑选一部分具有代表性的样本,用样本的情况,就能有效推测总体的状况。


8. 一个懂统计学的人,和完全不懂的人的区别在于:恰恰是懂的人知道,统计结果可能出错。反而是不懂的人,才认为统计一定要正确。

无论多么严密,统计学提供的只是一个概率。“黑天鹅”事件一定会出现、天气预报很可能不准……懂点儿统计学的人,对变化的宽容度会更高。


9. 当下,统计学正在经历自己的第三次高光时刻——大数据的兴起。

从统计学出发,随着计算机算力的提升,大数据内部分成了两派:一派坚持以经典统计学为基础,另一派则抛开统计实验,依赖算法的力量。两派分歧很大,到底谁代表大数据的未来?一切未知。


10. 同时,统计学也面临重要挑战:统计学的背后,是否存在价值观?

不妨思考几个问题:单纯从数据出发,算不算好的统计研究?为了获取用户数据,能否侵犯用户隐私?是否要迎合用户口味,只推荐他感兴趣的内容……这些都不是统计学本身的问题,但对统计学的发展,至关重要。


最后,让我们对《女士品茶》这本书的作者萨尔斯伯格 、邱东等译者 、出版方中国统计出版社,说一声感谢!

今日所得

1. 统计学就是通过收集、分析、解读数据,来解决现实问题。数据,是统计学的“灵魂”。

2. 世间万物并非是绝对的因果关系,很多结果的出现,都是随机的。

3. 恰恰是懂统计学的人知道,统计结果是可能出错的。不懂的人,才认为统计要百分之百正确。

如果你想了解更多,却又没有时间翻看原书,欢迎收听“每天听本书”的精彩解读

▽ 戳此收听

登录查看更多
0

相关内容

统计学(Statistics)是研究收集、分析、解读、展示及组织(collection, analysis, interpretation, presentation and organization)数据的学科,通过量化地研究随机性,从而理解数据的产生机制,并进行判别、预测、优化、决策。统计学理论和方法是很多现代科学分支的支柱,其广泛的应用深刻地影响现代生活,具有代表性的应用领域包括: 生物/医学(生物统计学,基因统计学,生物信息学,制药学等)
社会学/环境学(社会统计学,心理学,人口学,空间统计学,环境统计学等)
工业工程学(质量控制,可靠性分析等)
经济学/金融学(精算学,金融统计学等)
工程学/计算机科学(统计学习,数据挖掘,信号/图像采样/处理等)
基础科学(统计物理学,统计化学等)
【2020新书】从Excel中学习数据挖掘,223页pdf
专知会员服务
93+阅读 · 2020年6月28日
【2020新书】监督机器学习,156页pdf,剑桥大学出版社
专知会员服务
153+阅读 · 2020年6月27日
【MIT】Yufei Zhao《图论与加法组合学》,177页pdf
专知会员服务
51+阅读 · 2020年4月27日
2020年中国《知识图谱》行业研究报告,45页ppt
专知会员服务
240+阅读 · 2020年4月18日
德勤:2020技术趋势报告,120页pdf
专知会员服务
191+阅读 · 2020年3月31日
缺失数据统计分析,第三版,462页pdf
专知会员服务
109+阅读 · 2020年2月28日
一文读懂机器学习中的贝叶斯统计学
数据分析
26+阅读 · 2019年5月8日
荐书丨机器学习——Python实践(留言送书)
程序人生
7+阅读 · 2018年1月5日
【入门】数据分析六部曲
36大数据
18+阅读 · 2017年12月6日
干货|通俗易懂地解释EM算法并举例说明?
机器学习研究会
12+阅读 · 2017年11月17日
如何入门Python与机器学习 | 赠书
CSDN大数据
9+阅读 · 2017年11月12日
最可怕的不是被机器淘汰,而是……
全球创新论坛
18+阅读 · 2017年10月28日
从贝叶斯方法谈到贝叶斯网络
七月在线实验室
8+阅读 · 2017年7月6日
Adaptive Neural Trees
Arxiv
4+阅读 · 2018年12月10日
Arxiv
11+阅读 · 2018年5月13日
VIP会员
相关VIP内容
【2020新书】从Excel中学习数据挖掘,223页pdf
专知会员服务
93+阅读 · 2020年6月28日
【2020新书】监督机器学习,156页pdf,剑桥大学出版社
专知会员服务
153+阅读 · 2020年6月27日
【MIT】Yufei Zhao《图论与加法组合学》,177页pdf
专知会员服务
51+阅读 · 2020年4月27日
2020年中国《知识图谱》行业研究报告,45页ppt
专知会员服务
240+阅读 · 2020年4月18日
德勤:2020技术趋势报告,120页pdf
专知会员服务
191+阅读 · 2020年3月31日
缺失数据统计分析,第三版,462页pdf
专知会员服务
109+阅读 · 2020年2月28日
相关资讯
一文读懂机器学习中的贝叶斯统计学
数据分析
26+阅读 · 2019年5月8日
荐书丨机器学习——Python实践(留言送书)
程序人生
7+阅读 · 2018年1月5日
【入门】数据分析六部曲
36大数据
18+阅读 · 2017年12月6日
干货|通俗易懂地解释EM算法并举例说明?
机器学习研究会
12+阅读 · 2017年11月17日
如何入门Python与机器学习 | 赠书
CSDN大数据
9+阅读 · 2017年11月12日
最可怕的不是被机器淘汰,而是……
全球创新论坛
18+阅读 · 2017年10月28日
从贝叶斯方法谈到贝叶斯网络
七月在线实验室
8+阅读 · 2017年7月6日
Top
微信扫码咨询专知VIP会员