作者: 朱浩楠, 北京市十一学校数学教师.
[遇见数学]已获朱师授权发布, 这里特此感谢支持!
在终极的分析中,一切知识都是历史;
在抽象的意义下,一切科学都是数学;
在理性的世界里,所有判断都是统计。
——统计学领袖C.R.Rao
一个数学家的目的,是要了解数学。历史上数学的进展不外两途:增加对已知材料的了解,和推广范围。
——陈省身先生
“人工智能”和“大数据”在这几年里曝光率极高。它们似乎无处不在:智能手机、智能电视、智能购物、智能投资,甚至智能厨房。它们也似乎无孔不入:金融证券中的大数据、电子商务中的大数据、医疗制药中的大数据,甚至文物保护中的大数据。相关的案例可参见吴军先生2016年的著作《智能时代》,这里不再摘录。
从对社会的影响以及它所产生的财富来看,将人工智能与大数据的爆发看作是第三次工业革命,即信息技术革命的代表作,并不为过。人们在享受着智能科技带来的便捷的同时,也面对着它所带来的社会问题,甚至是伦理和法律的问题。好在广泛的讨论正在各个专业领域及互联网上如火如荼地进行,发展中的问题正在通过发展的方式逐步解决。
在教育行业,“大数据”这个名词近些年来也被“反复引用”,来评估学生学业、提供就业指导、生成练习题或试卷。甚至很多教育教学项目的申请书中没有“大数据”这三个字都不好意思拿出来立项,人人趋之若鹜。但是与此同时,关于人工智能、大数据与高中学科课程的结合,却没有被讨论很多。这里悄然藏着一个魔鬼,它挥舞着三叉戟抛出这样一系列问题:
人工智能和大数据到底应不应该作为课程被引入到高中阶段?
人工智能和大数据到底能不能作为课程被引入到高中阶段?
人工智能、大数据和传统高中学科课程的关联在哪里?如何引入?怎么教?
初看这三个问题,可能觉得它们之间是层层递进的关系,或者觉得是整体和局部的关系,但是不然。很多人面对前两个问题给出了否定的答案,其原因就在于第三个问题还没有答案。就好像高铁是个好东西,但是建国初我们没法建;航天飞机也是好东西,但是直到现在我们都没法造。一样事物的价值不能孤立地来评述,而是要看:到没到该有的时候、能不能造得出来、造出来能不能用、用了会不会有正面的推动——是代价和收益共同决定了这件事物在当前阶段的价值。于是上面的三个问题其实本质上就是:
人工智能和大数据引入到高中数学课程中来,对高中学科课程有无益处?代价是什么?
本文的目的,就是从中国大陆高中数学教育的角度,尤其是高中数学建模教育的角度,谈一谈对这个问题的认识和解答,一家之言,希望能抛砖引玉。下面将从三个方面展开:
(1)从数学的角度揭开人工智能和大数据的面纱——都是几何的问题;
(2)从高中数学建模教育的大概念去理解人工智能和大数据——视为难得的案例;
(3)从学科交叉的角度认识人工智能和大数据——基于目标的推动.
从狭义的角度提人工智能,其实指的就是“机器学习”。这个“机器”可以是计算机、单片机,也可以是其他形式的机械;这个“学习”,可以在软件层面上实现,也可以在硬件层面上实现。那什么又是“机器学习”呢?这就要涉及到一些概率和统计了。
统计,是人类对自然现象和社会现象的数学表达,概率则是这种表达所反映出的规律。不同的人看同一张画会有美与丑的分辨,随机的人也会产生随机的评判。但当评判的数量足够大时,规律便开始显现——更多比例的人会觉得《蒙娜丽莎》是美的,这也正是《蒙娜丽莎》是世界名画而我小时候画给母亲的画像只能算作是涂鸦一样,但是这并不妨碍我母亲将我的儿时作品装裱起来视如珍藏而对蒙娜丽莎毫无兴趣。
机器学习,就是要利用机器(最常见的是用计算机)上可以自动运行的算法,通过分析纷繁的样本,去寻找这些统计数据的分布规律,这个分布规律在数学上以函数的形式呈现,被称为概率密度函数,用它可以计算样本散落在某个区域里的可能性。为方便起见,我们记这个想要寻找的概率密度函数为F(x)。
寻找函数F(x),尤其是设计一套可以在计算机上自动运行的算法去寻找,并不是一个简单的问题。从上个世纪80年代开始,在MichaelI. Jordan等科学家们的探索下,逐渐形成了机器学习的下面这四个步骤[1]:
第1步:通过观察数据,选取(一般是靠不完全归纳)一个适当的函数模型(即带有参数的函数)G(x;a),这里a为参数(绝大多数时候,参数不仅一个,这里仅作为示例)。
第2步:建立一个度量泛函d(.,.),来衡量不同的函数G和F间的“距离”d(F,G)。直观上理解,这相当于建立了一个评价机制,以评价不同参数a所对应的G(x;a)谁更接近F(x)。
第3步:根据第2步建立的评价机制,用演绎的方法推导出迭代算法,利用这个算法,可以生成一串参数值a1,a2,a3,…,使得对应的函数G(x,a1),G(x,a2),G(x,a3),…,离F(x)越来越近。最终利用极限找到对F(x)逼近程度最佳的参数a的取值。
第4步:证明第1步选取的函数模型G(x,a)、第2步建立的度量泛函d、第3步推导出的迭代算法,对于数据源的有效性(即,能否达成目的)以及敏感性(即,换了一批数据后是否还适用)。
图1机器学习示意图
可不要小看这四步,它们各自都有着深刻的内涵。
在第1步中,为了找到适当的函数模型,数据是最关键的因素。如果数据不够多,选取的函数模型就很片面;如果数据不够及时,选取的模型又很滞后;如果数据的维度不够多样性,选取的函数模型往往会很怪异而且难以继续——就像是把一个立体的雕塑压缩到底面上,如果仅观察雕塑在底面上的投影,往往难以看出其本来的样子。所以我们希望数据能同时满足充分多、及时性和多样性。这也正是大数据所谓的3V特征[2](Volume、Velocity、Variety)。从这个角度来讲,大数据是人工智能的必然要求。
图2大数据的3V特征
图3数据多样性(维度)的降低会影响对数据的认知
在第2步中,合适的度量可不容易找到,这主要是在于直观想象和数学抽象之间的鸿沟——我们总希望找到的“距离”泛函是满足我们生活中对于距离的“感觉”的,具体来说有三条:距离总是大于或等于0、“A和B的距离”与“B和A的距离”在数值上相等、“A和B的距离为0”当且仅当“二者重合”。但是可惜的是,一般情况下,具有明显现实意义的度量往往不会同时满足这三条,而且问题往往出在最后一条上。几何上的解决办法就是利用一种“提升”,将问题放到更高的维度上去考虑。在数学上,这对应了代数几何学(AlgebraicGeometry)中一个非常重要的分支——奇点解消[3]。
图4奇点解消
在第3步中,由于实际工作中的数据往往维数很高,涉及到多维数据的运算,这时向量、矩阵以及向量空间也就被拉进了舞台。
在第4步中,一个重要的意识起到了作用,就是“不同的数据会对应不同的模型”。这是一种朴素的数据观,也是“奥卡姆剃刀”[4]即简单有效原理的一种表现——如果一个简化模型对于一类数据都是适合的,那么它就具有一定的应用价值。这个原理在14世纪由一位圣方济会的逻辑学家提出,它一直以各种形式左右着科技和历史的进程,在机器学习这里也是如此。这一步中往往要用到微分学,因为那正是一门考量自变量变化对因变量变化影响趋势的学问。
回顾这四个步骤,从第1步到第4步,无一不是几何问题:第1步中依据数据的空间分布寻找恰当的函数模型,相当于在寻找一类符合数据分布趋势的曲线或曲面;第2步中构建评价机制,也是通过建立“函数与函数的距离”来完成;第3步中,对高维空间的描述和线性空间中的运算,又是几何的内容;第4步中,求函数在某一点处的导数等价于研究这一点处函数图像切线的斜率,在高维中对应于研究曲面在某点处的切空间,这又具有很强的几何背景。这样看来,如果不考虑计算机编程实现,“机器学习”,或者说是其代表的“人工智能”,可不就是一个几何问题嘛!
上面的讨论将机器学习看成了一个几何问题——虽然中间穿插着代数、分析甚至拓扑技巧的使用——这样做有一个好处,就是很容易和高中数学课程的内容产生联系。
几何是纷繁复杂的,事实上在数学里3维的几何都还没有被研究清楚。在近代数学中,几何研究不断地向其它分支,如微分方程、拓扑和代数,提出关键的问题,这些问题极大地推动了这些分支乃至整个数学的发展。在1936年至2014年间菲尔兹奖的57位获奖者中,有30位的成果与微分几何或代数几何直接相关,比例超过一半[5]。这在分支如此庞杂的数学学科内实属难得,足见几何研究在数学研究中的核心地位。
在高中数学中也是如此。在新课标高考方案颁布之前,高考数学的6道解答题里,解三角形或三角函数、立体几何、导数、解析几何,共4道大题,都是几何背景的题目。这样安排的原因之一是:具有几何背景的题目可以极大地关联高中数学的重要知识点,容易命制综合题目。如果这样看,不仅仅在应试中,在高中数学的教学中,将几何作为一条主线,也是大有裨益的。
不仅如此,新课标中提出了6个高中数学学科核心素养[6]:直观想象、数学抽象、数学建模、逻辑推理、数据分析和数学运算。其中,数学建模是相较上一版课标新加入的一条,其作用是在学以致用的观点下,将其它5个核心素养关联到一起。所以数学建模作为核心素养,与其说是一种技术,不如说是一种意识或观念。
图5数学建模在六个核心素养中的作用
既然提出了核心素养,想要落实就不能不提到“基于标准的学习”。
“基于标准的学习”是时下热门的教育理念,但是什么才是真正的标准呢?我们绝不希望学生止于记住几条公式,或者记住一堆技巧,而应是习得属于学科本质的、在未来的很多年之中可以留在思维里并在工作和生活中反复加以使用的那些原理。这些最为核心地体现学科本质的原理,在国外大学先修课程体系中被称作“BigIdeas”,在中国被翻译成“大概念”。
2009年10月,来自美国、中国、英国、法国、加拿大、智利、墨西哥共10位IAP-IBSE专家委员会的专家汇聚苏格兰的罗斯湖畔,一起探讨在知识爆炸性增长、科学技术快速发展的形势下,基础教育阶段的科学教育应该如何进行。该会议的成果为《科学教育的原则和大概念》一书,该书明确给出了科学教育的10项原则和基础教育阶段应该学习的14个科学大概念[7]。
可惜的是,虽然书中的14个大概念包含了4个学科的内容,但其中并没有包括数学。这里面有非常深刻的原因,不是本文讨论的要点。本文也无力给出数学学科的大概念。但是着眼于“数学建模”这一个核心素养,将其继续细分,我想可以提出如下的5条针对高中数学建模的“大概念”:
(1)数据中反映的信息能够被抽象成某些数学模式。
(2)基本假设是模型的公理化体系,不同的基本假设代表不同的观点,基本假设需要根据模型效果反复修正。相似的模型可用于解决具有等价基本假设的问题。
(3)数学模型的建立包括评价函数(或数学方程)的寻找,以及约束条件(或边界条件)的确定。
(4)参数的灵敏性分析可以为先验设定提供依据,同时也能帮助寻找核心参数。
(5)具有合理基本假设且用恰当数学方法求解的数学模型可以用来解释客观世界,并指导现实工作。
如果将前面机器学习的4个步骤和上面的这5条大概念放在一起,就会惊喜地发现:机器学习,或者说是其代表的人工智能与大数据,就是体现这5条大概念的一个优质案例。
图6机器学习4步骤与数学建模5条“大概念”间的对应关系
既然是优质案例,就需要考虑如何在课堂当中去落实。这时首要考虑的就是学生的学情。
目前中国大陆地区的高中生,在高一时学习集合、基本初等函数、三角函数、解三角形、向量、数列、不等式,在高二时学习解析几何、立体几何、一元函数微积分初步和概率统计。在常规课程里面并没有涉及到线性代数,也没有涉及到多元函数微积分。但是线性代数以及多元函数微积分又在机器学习的理论中扮演了重要助手的角色。同时,高一的学生刚刚学习完基本初等函数之后,还没来得及见识丰富的函数的例子,对函数模型的经验储备也不足,这就使得机器学习的第一步无法有效进行。不仅如此,因为智能科技多以封装完善的产品被大众使用,大众并不了解也无需了解“智能”的数学来源,这就使得学生在刚刚接触机器学习时,对“智能”这个名词会产生困惑。
通过以上三个角度的观察,归纳出机器学习这个案例在落实的过程中将面临的三个矛盾:
矛盾1:机器学习理论中所需的丰富数学基础,和高中数学课内知识相对单薄间的矛盾。
矛盾2:机器学习对于函数模型的经验需求较高,和高一学生经验不足间的矛盾。
矛盾3:机器学习的“智能”源自数学结构,和学生感受的“智能”多源自生活间的矛盾。
解决这三个矛盾的诀窍,就隐藏于“分层分目标的教学”中。
首先,机器学习作为高中数学建模的案例,应放在高中高年级(高二或高三)进行教授。此时学生已经接受过基本的数学建模思维的渗透,并且对于函数模型有了初步经验。这样可以解决矛盾2。
同时,在介绍复杂的机器学习机制(例如神经网络)之前,应先通过简单的数学结构来引导学生观察智能的来源。一个经典的例子是利用连分数求根号的近似值,另一个例子来自于函数值迭代的收敛性。这些材料可以在高一和高二上的相关章节予以渗透,并引导学生理解机器学习中的“智能”的数学来源其实是:极限和稳定收敛性。这样可以部分地解决矛盾3。
图7所谓的智能,来自于极限和稳定收敛性,
这可以通过非常简单的例子传递给学生。
进一步地,讲授机器学习不宜对所有学生采用统一的要求和标准。即使未来的世界是人工智能和大数据大放异彩的时代,也并非所有想要在这个时代有所成就的人都需要掌握机器学习的技术。事实上,很多人只要了解机器学习最基本的概念和方法,并赏析几个机器学习的实例,以保证他们将来想要应用机器学习时,可以找到正确的方向和擅长该技术的合作伙伴就足够了。而有更高需求的同学可以利用校本选修课和大学先修课补足深入学习所需的知识。这就解决了矛盾1。
这样的考虑实际上给出了高中阶段讲授机器学习的三个原则:
原则1:机器学习的教学适合在高中高年级展开,作为高中数学建模教学的案例。
原则2:利用数学课内题目,向学生渗透“智能”来自于“极限和稳定收敛性”。
原则3:按学生兴趣社团、常规课程、校本选修课程的三级,由浅入深分层分目标实施。
这样做的另一个好处,就是对于师资的要求相对降低,不需要另外聘请很多人工智能方面的专家,只需要稍加培训,就可以完成绝大多数情况下的教学工作。
作为缩写,“STEAM”代表科学(Science)、技术(Technology)、工程(Engineering)、艺术(Art)、数学(Mathematics)。STEAM教育就是集科学、技术、工程、艺术、数学多学科融合的综合教育。通常认为,STEAM教育相较大陆传统教育可以带来如下6个好处:
(1)激发好奇的天性和主动探索能力;
(2)培养孩子各方面技能和认识能力;
(3)在动手实践过程中培养创新意识;
(4)引导同伴之间的合作和强调解决问题的能力;
(5)重视对艺术、文化软实力的培养;
(6)创造机会让孩子去发展有趣的创意思维。
但是好处归好处,好处可不是由简简单单的一个称为“STEAM”的名词带来的,而要靠将这个理念在课堂上基于学情和课标去科学地落实来获得。
人工智能和大数据本身就是一个需要多学科协作的庞大工程——数据样本采集自各领域,采集的方式要依靠各个学科的专门技术,以及相应的电子设备;数据的储存和传输依赖于半导体技术、材料科学和通信科学的发展;有了数据,算法的理论支撑来自于数学,算法的实现则要靠计算机科学乃至电子科学,结果的应用又要依赖各个领域的专门人才。所以很容易将人工智能和大数据放到“交叉学科”这个范畴中来。
交叉学科缘起于学科交叉,是两个或多个学科相互间的合作不断深化的产物。例如近年来新兴的进化金融学(EvolutionaryFinance),就是生物学和金融学之间学科交叉的产物,演化证券学(EvolutionaryAnalytics ofSecurity)则是生物学和证券学之间学科交叉的产物。交叉学科激发了很多新兴的技术和职业,也是人类知识和社会财富爆发增长的一个源泉。
这很容易让人产生一种幻觉:让学物理的人去做化学,让学数学的人去做生物,让学金融的人去做医疗,就搭上了“学科交叉”的顺风车,就可以获得名利。之所以会产生这样一种幻觉,是因为只关注到了成功者在多于一个学科内所取得的成就,和他们将这些成就整合起来的影响。但是却忽略了一个浅显的事实:这些人要么本身就同时在多个学科都有非常专业的功底,要么就是找到了擅长不同学科的人来合作。
所谓“学科交叉”,不是把问题在多个领域之间翻译来翻译去,而是多个学科相互合作、各自解决同一个大问题中自己擅长的那部分,最后将结果整合起来。
图8学科交叉不是学科间的“走马秀场”
“用学科的语言解决学科内的问题”,在教育中,尤其在基础教育阶段,非常重要。以人工智能为例,它可以作为一门数学选修课,也可以开设成计算机选修课。学生如果想要学习数学理论的部分,就去上数学选修课,如果想要去学习计算机实现的部分,就去上计算机选修课。最可怕和耽误时间的,就是在数学课上讲计算机,而在计算机课上讲数学——当然,这不是对数学课上使用信息技术而在计算机课上使用数学的否定,只是针对课程目标来说——如果学生对两个方面都感兴趣,且有时间和精力,那就同时去上这两门选修课。甚至数学理论和计算机实现可以合并在同一门选修课中各自作为前后几个章节,但是绝不可以用计算机科学的语言去讲数学的理论,又用数学的语言去讲计算机科学的技术——一旦这样做了,学生将失去扎实的学科基础,将来也解决不了交叉学科的问题——就好像一个电工,本来可以背上一个分门别类的工具箱去工作,遇到什么情况就抽取什么类别的工具,清晰又迅速;他却把所有工具一股脑放进一个大口袋里,遇到情况找来找去也找不清楚。更可怕的是,如果这位电工是个新手,还很容易因为认错工具而发生安全事故。
作为北京市十一学校兄弟学校的青岛中学在这方面的指导方针是值得佩服的:讲到海洋时,语文、数学、英语、物理、化学、生物、地理、历史、政治所有的学科都在讲各自学科内所认识的海洋——学生在语文和英语课上赏析了有关海洋的诗词文章和异国文化,在数学课上利用解三角形完成了航线的测定,在物理课上通过潮汐明白了万有引力;生物课将海洋里丰富多彩的生态系统介绍给学生认识,地理课上师生讨论哥伦布和郑和的航海大发现,历史课又将这些与黄仁宇的《万历十五年》联系起来,政治课则利用哥伦布和郑和背后政体的不同阐释了大国兴衰崛起的奥秘——每个学科用自己的语言讲自己学科的故事,最后学生看到的才是层次分明,五彩斑斓的立体海洋图景。
同样的方法也可以适用于人工智能和大数据在高中阶段的教育。基于目前中国大陆高中师资水平及其工作量上的考虑,建议还是拆分成多个选修课,由不同的教师负责教授不同的部分。这些教师可以组成一个课题组,不定期研讨、协调各课程进度和设计,以期服务于学生的系统性学习。当然,根据不同地区和不同学校的学生学情,对内容的取材上要有所取舍,不可以让学生吃夹生饭,宁可减少课程容量,也应首要保证课程的系统性。
最后,作为本文的结尾,必须要谈一个沉重的话题,那就是新技术在带来新兴行业和更多知识、财富、便捷的同时,所带来的社会问题——劳动力析出,社会稳定性降低。正如吴军先生在《智能时代》这本书中提到的[8]:“每一次重大的技术革命都需要很长的时间来消除它所带来的负面影响。因为技术革命会使得很多产业消失,或者产业从业人口大量减少,释放出看来的劳动力需要寻找出路。这个时间有多长呢?事实证明至少要一代人以上,因为我们必须承认一个并不愿意承认的事实,那就是被淘汰的产业的从业人员能够进入新行业中的其实非常少。”
这是一个历史进程中必然面对的问题,可能永远不会有十全十美的解决办法。但是至少一个可以尝试的办法是将人工智能和大数据引入到旧的行业,例如十一学校数学建模实验室在2017年5月开始和国文科保公司开展的一个长期合作计划——将数学建模引入到文物保护(先期是石刻文物的保护)中去,为文物工作者提供文物保护的预警和效果分析——这是学生们利用新的理念创造新的技术的实践平台,也给传统行业带来了活力、提升了效率。
这是最好的时代,技术、知识、财富飞速发展,人类不断地从造物主手中窥伺到制衡自然法则的方法;这也是最坏的时代,伦理、道德、法律遭到践踏,人类面对着前所未有的危机和疑虑。对于一个国家,未雨绸缪仿佛是政府和决策层才需要考虑的事情。但是作为中国知识分子,“苟利国家生死以,岂因祸福避趋之”并不仅仅是一句应该被遗忘在历史中的口号。用新的技术造福社会,避免危机,才是这个时代留给知识分子的终极课题。
[1]Sumio Watanbe, Algebraic Geometry and Statistical Learning Theory,Camberidge Monographs on Applied and Computational Mathematics,Camberidge University Press.
[2]互联网数据中心,https://www.idc.com.cn/.
[3]Robin Hartshorne, Algebraic Geometry, GTM, Springer.
[4]维基百科:https://en.wikipedia.org/wiki/Occam%27s_razor/.
[5]维基百科:https://en.wikipedia.org/wiki/Fields_Medal/.
[6]教育部基础教育课程教材专家工作委员会,普通高中课程标准修订组,《普通高中数学课程标准》,征求意见稿.
[7]温·哈伦著,韦钰译,《科学教育的原则和大概念》,科学普及出版社,2011.7.
[8]吴军,《智能时代》,中信出版社,2016.8.
(全文完)
编辑丨王利君
教师感悟系列文章:
-【聊聊命题这件事】
「予人玫瑰, 手留余香」
如果能帮助[遇见数学]更快发展, 非常感谢!