编者按:地球是人类共同的家园,地球的健康是人类永续发展的前提。对此微软提出了行星计算机计划,建立连结数万亿环境数据和微软强大 AI 能力的数据库,以供学者研究和政策参考。在 2020 WAIC 云端峰会微软论坛上,清华大学理学院院长、地学系主任宫鹏教授和微软亚洲研究院副院长潘天佑博士围绕 AI 如何帮助解决地球和环境挑战展开了对话,下面一起来回顾一下精彩内容。
潘天佑:地球是我们所有人的家,我们希望地球永远健康、美丽、适合人类居住。但要如何实现这一目标?让我们来请教清华大学理学院院长、地球系统科学系主任宫鹏教授。我想首先问一下,地球系统科学系是怎么样的一个系?当初成立时你们有什么样的想法和愿景?
宫鹏:这要从20世纪科学的发展以及人类面临的一些难题开始讲。20世纪科学发展的总体趋势是深化和分化,就是越做越细,比如说某科学地理学会分化出气象学、水文学甚至和生物学结合的生态学、海洋学,还有环境科学。
可是上世纪后半叶我们遇到很多问题,资源在可见的未来里会枯竭,能源出现危机,还有气候变化这样影响全人类的问题,它们很难用原来那种细分的学科发展去解决,于是出现了从全球系统角度发力的研究。这种研究在地学里最好的体现就是地球系统科学的提出。地学不同学科的学者认识到我们需要把以前那些深化的地学学科和其他学科建立连接,实现多学科和跨学科的组织来寻找科学的答案,解决复杂的系统性的问题。
因此清华大学选择了地球系统科学作为发力点,目标就是要用全球的视野、系统化的思维和多学科交叉的路径来解决人类面对的问题。
微软亚洲研究院副院长潘天佑博士(左),清华大学理学院院长、地学系主任宫鹏教授(右)
潘天佑:您刚刚特别提到地球系统科学系的使命,您认为现在地球最大的问题是什么?
宫鹏:简单来说是地球生态系统无法支撑人类发展需求的矛盾。地球生态系统包括陆地生态系统和海洋生态系统,需要各种各样适宜的条件来给生态系统生长的空间,我们叫生态位。气候的变化、生物多样性的锐减、环境的污染、城市化等等让地球生态系统的繁荣空间不断受到挤压,它服务自身和人类需求的能力逐步减少,而人口增长却使人对自然环境的需求越来越高。因此人类活动加剧造成地球生态系统服务功能的降低和衰退,是地球今天面临的最大挑战。
潘天佑:微软首席环境官 Lucas Joppa 博士提出为地球构建一个行星计算机,它能将全球的资源数据整合起来,使用人工智能算法更好地维护地球。在他的短片中特别提到了跨领域合作,刚刚宫教授也提到了您的系也是跨学科合作,我们常说跨学科其实很困难,您认为跨学科的主要挑战在什么地方,如何把跨学科做得更好?
宫鹏:这个问题非常好,我们系里有大气科学家、海洋科学家、地理学家、生态学家、经济学家还有计算机专家,是一个多学科的队伍。
Lucas 说的行星计算机是一种美好的愿望,我们在逐步朝那个方向努力,它要求的是非常细致的对地球的观测。我们从30多年前就希望有一个数字地球,后来随着存储能力、云计算能力的加强,传感器采集能力的提升,我们除了影像,还可以把震动、气味、化学传感、动力传感都接收和记录下来,所以我们确实有望能更细致地记录地球。
有了这个观察以后,就需要用地球观测数据去支持地球系统理论的提升,并且用计算机来模拟真实的世界。我们希望把计算机的模拟能力、科学的认识和数据观察的发现结合起来,去支持政策的评价。如何采取一些政策来规范人类的行动,或者调动各种各样的社会资源去应对我们面临的问题,这其实有很多路可走,我们需要去评价和找出最优化的路径。但是在现实世界里做实验太慢了,所以就需要计算机来完成这项工作,对地球系统面临的难题——人口爆炸、地球承载力衰弱、生物多样性锐减、环境污染等问题采取一些系统的手段,同时发展政策也是需要用计算机来评估的。所以在这个领域里,我们发展了一个学科,计算地球科学,用地球系统的大数据对一草一木的状态通过几何模型进行计算,把它一天和一季的生长规律都编码在计算机里。
学科交叉有什么好处呢?一个学地学的人可以通过编程来根据自己对世界的认识模拟一个过程。我们在建系之初就做了一个实验,有一个哈佛大学发展起的大气化学模型 GEOS-Chem,用于模拟地球大气里特定的化学元素的迁移、转化,当我们邀请计算机学者一起来看这个模型的时候,他们对这个程序做了调整和优化,让这个程序的效率提升了70倍。
最好的学科交叉是一个学者自己兼具多个学科的营养,但这种情况容易走不深,因为一个人的精力毕竟有限,所以做多学科交叉的时候就需要更多的人一起来工作。那么,人多了之后多学科交叉的困难和挑战就是沟通成本,就是大家能不能通过协同一致的、非常低成本的交流就能知道我们的目标和如何共同去完成一项工作。如果大家都很默契,已经建立了很好的相互配合,多学科交叉的效率就会提高。
清华大学理学院院长、地学系主任宫鹏教授
潘天佑:您刚刚提到计算机在地球科学里面所扮演的一些角色,这也让我想到了几年前微软亚洲研究院跟贵系一起合作过一个海冰追踪的研究。这些跟我们所提到的行星计算机有异曲同工之妙。你认为计算机科学未来还能如何帮助地球?
宫鹏:一方面,一草一木放到计算机里是一个美好的理想,但现在还做不到,因为它们在地球上的量是极其巨大的。另一方面,我们希望行星计算机能把人和自然结合在一起,因为我们是地球系统中的一部分。人的活动、人的行为、人的心理、人的思维全部都要和自然系统记录在一起,进行系统的思考。
我们下一步怎么做?现在有一些什么样的问题呢?我们需要刻画地球越来越精细的地表覆盖,地表覆盖是一种物理特性,就是从天上看地表是什么样的。如果光看物理的和能量的交换,地表覆盖的这种类型支持着我们去理解地球上的能量平衡。如果下了雨,哪个地方是吸水的,哪个地方是不透水的,让水流到别的地方,地表覆盖决定着降水的再分配这些过程。所以地表覆盖对地球上的自然过程是有调控作用的。
土地利用就是人如何利用土地,比如我们这片城市的区域是被大家用来居住的,微软大厦的所在地是被大家用来工作的,在城市里面的土地利用有多种多样的形式,有的是混合用的,有的是单纯的用于某一种目的的。这个不是简单的用卫星直接就能看到的,也就是说,下一步我们可能用卫星直接跟地表的物理特性、土地覆盖去建立联系,这部分目前已经做得挺好的了,虽然还有一些困难,但我们在局部的尺度已经可以做得挺好了。那抽象的概念如土地利用和人类活动,这一类的推理则需要更强大的计算能力来实现。
在我们做全球地表覆盖制图以前,世界上的地表覆盖制图的分辨率是300米,我们在8年前把这个分辨率提高到30米,提高了一个数量级。去年我们又发表了一个成果把全球尺度从30米提高到了10米。现在我们基本上完成了对中国的3米分辨率制图。所以你可以想像 Lucas Joppa 提出的期望是做1米分辨率地表覆盖制图,做更细的制图。
从小的角度来说,我们将来对地球的了解需要越来越细致的信息,除了传感能力要能够得到地表很细致的数据以外,我们还要去推测地表覆盖是一个什么样的物理类型。再往下,我们还可以计算很多的东西,比如逐步细化特定的空间单元,它的三维特征、高度、覆盖情况,都需要更定量化地深化研究。当我们要做3米分辨率全球尺度的制图,就已经需要几个 PB 的存储能力了。光这一层数据就要这样,如果原始资料全部积累起来,那会更大。在规模上又是一定要深化方向的,就是在提取对地球的刻画的专题类型上,我们会得到很多很多层的信息。
还有一个就是抽象的地球认识,比如推导计算土地利用,对计算机的要求也非常高。可以说将来我们对存储和运算速度的要求极其巨大,现在全球的计算机还达不到这样的能力,所以我们还要进一步发展。这些是地球观测的要求,还有对地球系统的预测,比如降水、气温、风向、气压、湿度等一系列大气环境,洋流中的污染物,哪些地方的海洋因为缺氧已经变成了死区,这些都是可以通过模型和观测结合起来去实现的。但要实现到多细?现在全人类的这类研究中最好的分辨率才3公里,连一场飓风、龙卷风这样的活动都不能模拟。
现在大家一般做的是在25公里到100公里尺度上对地球进行分区,还有对地球垂直方向上划分出一些立方型的分块。全世界最近一次模式评估,一个地方产生的数据就是十到几十 PB 量级,已经没有办法用互联网及时传送到其他地方让大家来用。所以这一切挑战对地球系统、行星计算机的要求可想而知,我们还有很长的路要走。
潘天佑:最后我想请教您一个问题,我们一再讲数据,其实我们在很多不同的学科里面可能都有大量的数据,例如说我们讲行星计算机,里面一个很大的环节是能够怎么样把这些东西连接起来,所以怎么样让数据能互相无缝交流,但又没有信息安全的顾虑,您对这种所谓的数据分享、数据交流有什么看法?
宫鹏:我有一个很大的期望,不管是有偿的还是无偿的,其实要提出一个协议让大家去做数据的分享。我们太需要实现数据的共享了。数据是大家的财富,每个人都可以通过合理规制数据的分享来获得自己应得的价值分配,如果数据不能放到一起,那它的用处是非常小的。数据共享是一种巨变,能够带来巨大的财富和价值。我自己深信数据共享的价值,所以在清华大学我们就把我们做的这些数据全部免费放在网站上实现共享。可以看到大家确实有需求,在8年的时间里有几千万的下载量。所以我觉得大家如果都去实现这种分享,那么我们对数据的依赖会轻一些,而且有好多问题也都能被解决。
潘天佑:几十年前学界就推动开源,其实今天在人工智能的时代,我们要的不只是开源,我觉得把数据分享出来让大家一起使用,也是一件刻不容缓的事情。我们也相信学术界、产业界、政府大家可以一起来做数据共享这件事情。谢谢宫教授!
只有当人工智能算法本身具有可持续发展性,它才有资格、有能力去助力其他关键领域的技术转型。我们热切地呼吁人工智能领域的研究人员和从业者共同努力、精诚合作,用可持续发展的人工智能技术去真正推动人类社会的可持续发展。
你也许还想看: