【科普】吴飞教授:《走进人工智能》---第4讲 从信息载体到智能燃料:数据的蝶变∣从数据到数治

2022 年 3 月 16 日 中国图象图形学学会CSIG
由高等教育出版社、高等教育电子音像出版社出品,浙江大学上海高等研究院联合上海人工智能实验室智能教育中心共同打造了原创人工智能前沿科普有声通识数字栏目——《走进人工智能》,主理人为浙江大学上海高等研究院常务副院长,浙江大学人工智能研究所所长、中国图象图形学学会理事、动画与数字娱乐专业委员会副主任 吴飞教授 ,本栏目已在喜马拉雅平台正式上线。




本期内容为《走进人工智能》:第4讲 从信息载体到智能燃料:数据的蝶变∣从数据到数治


《走进人工智能》

第4讲
从信息载体到智能燃料:数据的蝶变

你好,这里是吴飞的数字专栏《走进人工智能》。上一讲我们介绍了逻辑推理与优化搜索,他们是早期人工智能进行问题求解所采用的主要方法。在专栏的第四讲,我为你准备的内容是“从信息载体到智能燃料:数据的蝶变”。人类文明发展历史离不开“结绳记事”和“有册有典”的信息记录,合理应用数据,使其成为个人生活、社群管理和国家治理的重要手段。在数据密集计算年代,数据从单纯的信息载体变成了人工智能模型的燃料,成为信息时代“新的石油”,使得人类计算迈入数据密集型计算范式时代,完成一次又一次的蝶变。 

从数据到数治:战国平籴法和明朝黄册库

在拉丁语中,数据(data)是datum的复数形式,由给予(to give)的拉丁过去分词敢于(dare)派生而来,字面意思是“给予的东西”。作为人类对客观世界进行描述的记录手段,数据扮演了文明记录和信息交流等角色。《周易·系辞》中曾言:“上古结绳而治,后世圣人易之以书契,百官以治,万民以察”。在马克思为摩尔根《古代社会》一书所写的摘要中曾经说明过结绳记事,他记载道:“由紫色和白色贝珠的珠绳组成的珠带上的条条,或由各种色彩的贝珠组成的带子上的条条,其意义在于一定的珠串与一定的事实相联系,从而把各种事件排成系列,并使人准确记忆。这些贝珠条和贝珠带是易洛魁人唯一的文件,但是需要有经过训练的解释者,这些人能够从贝珠带上的珠串和图形中把记在带子上的各种记录解释出来。”在非洲的斯威士兰发现的列彭波骨(Lebombo Bone)和在刚果发现的伊尚戈骨(Ishango Bone)是迄今为止所知最早的计数工具,距今已有上万年的历史了。我们的祖先在这些兽骨上面用一道道刻痕记录着不同的数字,以帮助计算,因此历史学家一般把它们作为算术起源的证据。

既然数据是记录个体生活、社区交往以及国家运行等过程的载体,数据也就慢慢成为国家治理基础。商鞅曾说“欲强国,不知国十三数,地虽利,民虽众,国愈弱至削”,其明确提出要治理好一个国家需要知晓十三数,包括粮仓和府库的数目、成年男女数目、老弱人士数目、官吏数目、商人的数目以及马牛和草料数目等。同时,古人开始对所记载信息的数据进行分析处理,挖掘信息中蕴含的巨大价值。将数据分组是中国古代利用数据而产生价值的一种有效手段。零散数据被分组之后变得有条理,更易透彻了解数据所蕴含的价值。“观其所聚,则天地万物之情可知矣(《周易·泽地萃》)”。如战国时期魏国宰相李悝将农民种地的好年成分为上、中、下三等,坏年成也分为上、中、下三等。在丰收年,国家按照丰收的程度以不同力度收购多余的粮食;而在歉收年则按歉收的程度,国家以不同力度平价卖出粮食,这种防止“谷贱伤农,谷贵伤民”的“平籴法”是古代人们利用数据来有效治理国家的手段。

洪武十四年(1381年),朱元璋将记录着乡贯、姓名、年龄、丁口、田宅、资产的黄册堆放于南京玄武湖这一禁地,至明朝灭亡时,堆放于玄武湖的黄册已达到了百万之册,在没有电脑的时代,所建立的国家数据库达到了“收税有据,束民有方”的目的。

可见虽然古代尚没有人工智能算法与模型,但是数据已经在国家治理等方面开始产生价值,因此这对数据的质量也提出了严格要求。公元1645年,清军攻占南京后,对存放于玄武湖的黄册库很感兴趣,打开黄册库房一看,没想到黄册上所记录人口、田产等信息已经编排到了崇祯二十四年,而明朝末代皇帝朱由检早于崇祯十七年在煤山自缢而死,黄册记录信息已“人为超前”了七年之久。

产品名称:走进人工智能∣有声通识十五讲

主理人:吴飞

出品机构:高等教育出版社 、高等教育电子音像出版社

合作机构:浙江大学上海高等研究院、上海人工智能实验室智能教育中心

出品时间:2022年1月




中国图象图形学学会高校志愿者招募
中国图象图形学学会关于征集2022重大科学问题、工程技术难题和产业技术问题的通知
中国图象图形学学会关于组织开展科技成果鉴定的通知

2022年CSIG图像图形中国行承办方征集中

登录查看更多
1

相关内容

吴飞,浙江大学上海高等研究院、常务副院长、求是特聘教授、国家杰青获得者、浙江大学人工智能研究所所长;科技部重点研发计划项目负责人,主持国家自然科学基金重点项目2项。主要研究领域为人工智能、多媒体分析与检索和统计学习理论。入选“高校计算机专业优秀教师奖励计划”,曾获宝钢优秀教师奖。中国工程院院刊Engineering信息与电子工程学科执行主编。著有《人工智能导论:模型与算法》,开设国家级首批一流线上课程《人工智能:模型与算法》。
【智慧城市】《社会5.0下的智慧城市实施》(附PPT)
专知会员服务
41+阅读 · 2022年3月27日
弗里堡大学教授Martin新书《因果分析》,365页pdf
专知会员服务
143+阅读 · 2022年2月12日
数据中心产业图谱研究报告,41页pdf
专知会员服务
53+阅读 · 2022年1月31日
智能无人集群系统发展白皮书
专知会员服务
295+阅读 · 2021年12月20日
中科大-人工智能方向专业课程2020《脑与认知科学导论》
【科普】吴飞教授:《走进人工智能》---第9讲 东风不与周郎便
中国图象图形学学会CSIG
0+阅读 · 2022年4月14日
【科普】吴飞教授:《走进人工智能》---发刊词
中国图象图形学学会CSIG
0+阅读 · 2022年3月1日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
9+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Arxiv
1+阅读 · 2022年4月19日
Arxiv
21+阅读 · 2019年8月21日
VIP会员
相关VIP内容
【智慧城市】《社会5.0下的智慧城市实施》(附PPT)
专知会员服务
41+阅读 · 2022年3月27日
弗里堡大学教授Martin新书《因果分析》,365页pdf
专知会员服务
143+阅读 · 2022年2月12日
数据中心产业图谱研究报告,41页pdf
专知会员服务
53+阅读 · 2022年1月31日
智能无人集群系统发展白皮书
专知会员服务
295+阅读 · 2021年12月20日
中科大-人工智能方向专业课程2020《脑与认知科学导论》
相关资讯
【科普】吴飞教授:《走进人工智能》---第9讲 东风不与周郎便
中国图象图形学学会CSIG
0+阅读 · 2022年4月14日
【科普】吴飞教授:《走进人工智能》---发刊词
中国图象图形学学会CSIG
0+阅读 · 2022年3月1日
相关基金
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
9+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员