【科普】吴飞教授:《走进人工智能》---第4讲 大数据与小数据:幸存者偏差的启示

2022 年 3 月 17 日 中国图象图形学学会CSIG
由高等教育出版社、高等教育电子音像出版社出品,浙江大学上海高等研究院联合上海人工智能实验室智能教育中心共同打造了原创人工智能前沿科普有声通识数字栏目——《走进人工智能》,主理人为浙江大学上海高等研究院常务副院长,浙江大学人工智能研究所所长、中国图象图形学学会理事、动画与数字娱乐专业委员会副主任 吴飞教授 ,本栏目已在喜马拉雅平台正式上线。




本期内容为《走进人工智能》:第4讲 大数据与小数据:幸存者偏差的启示

《走进人工智能》

第4讲
从信息载体到智能燃料:数据的蝶变

大数据与小数据:幸存者偏差的启示

以数据为燃料,通过人工智能方法这一引擎从数据中获取知识、进行决策,体现数据的价值是一项充满挑战的任务。这里就会碰到一个问题,给人工智能这一引擎供应的数据燃料多少合适呢?

一般情况下,大数据支撑着当前人工智能的发展,大数据一直被奉为机器学习成功的关键钥匙。但是,人工智能不等于大数据。实际上,大数据中总存在一批“代表性小数据”,通过对小数据的分析理解,可洞察大数据所蕴含的规律。二战期间,为了加强对战机的防护,英美军方调查了作战后幸存飞机上弹痕的分布,发现返航的幸存飞机中机翼上弹痕最多,于是倾向于加强机翼的防护。然而美国哥伦比亚大学统计学教授沃德(Abraham Wald)力排众议,指出更应该加强弹痕少的飞机机尾引擎部位防护,因为这些部位一旦受到重创,很难有机会返航。事实证明,沃德教授是正确的。这个故事说明,我们可以从小数据中推知大数据所蕴含的普遍真理,只要思维推理的方法正确就可以克服“幸存者偏差”。要掌握支撑正确决策所需的“代表性小数据”,就需要提及统计中的采样技术。采样指从目标总体中抽取一部分个体作为样本,通过观察样本的某一或某些属性,依据所获得的数据对总体的数量特征得出具有一定可靠性的估计判断,从而达到对总体的认识,正所谓“管中窥豹、见微知著”。在采样这一理论方法尚未被大家所接受之前,人们对统计所秉承的“以偏概全”这一思想嗤之以鼻,英国前首相本杰明·迪斯雷利(Benjamin Disraeli)有一句著名的话:世界上有三种谎言,分别是谎言、该死的谎言和统计。实际上,大数据中总存在一批“代表性小数据”,通过对小数据的分析理解,可洞察大数据所蕴含的规律。获得代表性小数据的采样方法是一种重要的计算思维。马寅初曾说:“学者不能离开统计而究学,实业家不能离开统计而执业,政治家不能离开统计而施政。”实际上,国家所进行的人口普查,不就是从科学采集的代表性人口小数据中去分析举国人口状况么? 

当然,对于今天人工智能模型而言,对大数据越来越依赖,对大数据的利用能力也在不断增强。例如,在互联网商务领域中,众多APP会收集亿万用户性格、年龄和喜好等特征,构建“用户画像”,然后针对性地向用户推荐产品,提升广告投放效果;在医疗领域,通过临床诊断中所收集的大数据,对病人身体特征和疗效数据进行分析,早期预警疾病或避免药物过敏反应等;谷歌公司通过研究人们在互联网上的搜索记录,就能够预测季节性流感的爆发和传播。大数据中蕴涵着丰富立体的信息,社会已进入以“大数据”为新能源驱动的移动互联时代,大数据甚至被誉为智能时代的新石油。

产品名称:走进人工智能∣有声通识十五讲

主理人:吴飞

出品机构:高等教育出版社 、高等教育电子音像出版社

合作机构:浙江大学上海高等研究院、上海人工智能实验室智能教育中心

出品时间:2022年1月




中国图象图形学学会高校志愿者招募
中国图象图形学学会关于征集2022重大科学问题、工程技术难题和产业技术问题的通知
中国图象图形学学会关于组织开展科技成果鉴定的通知

2022年CSIG图像图形中国行承办方征集中

登录查看更多
0

相关内容

美智库最新报告:小数据人工智能潜力不可估量,39页pdf
专知会员服务
73+阅读 · 2021年11月18日
专知会员服务
55+阅读 · 2021年5月17日
【经典书】统计学,806页pdf,解锁数据的力量
专知会员服务
79+阅读 · 2020年8月12日
专知会员服务
124+阅读 · 2020年3月26日
【科普】吴飞教授:《走进人工智能》---发刊词
中国图象图形学学会CSIG
0+阅读 · 2022年3月1日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
Arxiv
19+阅读 · 2021年4月8日
Arxiv
27+阅读 · 2021年2月17日
VIP会员
相关资讯
【科普】吴飞教授:《走进人工智能》---发刊词
中国图象图形学学会CSIG
0+阅读 · 2022年3月1日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员