AI for Science时代,知识何存?

2022 年 1 月 6 日 THU数据派


  
  
    
来源:AI科技评论

  本文约4502字,建议阅读9分钟

本文介绍 了入选达摩院2022十大科技趋势的“AI for Science”


AI for Science为何重要?实际上,它是比知识与数据协同范式的影响更为深远的发展方向。

科学研究有两大基本目的:一是寻求基本规律,二是解决实际问题。在量子力学建立之时,狄拉克就预言说寻求基本规律的任务已大体完成,但因为其数学问题太复杂,用基本原理来解决实际问题非常困难。直到上世纪 50 年代电子计算机开始投入使用,以及微分方程数值方法的出现,人类才第一次大规模实现了从基本原理出发解决实际问题的能力,并由此构建起了现代工业和技术赖以生存的基础。”


“但这依然没有解决「维数灾难」问题,而机器学习恰恰是我们过去缺乏的工具。机器学习、科学计算、高性能计算三大工具的结合,将推动科学研究从小农作坊模式转变到大平台模式,即由整个科学家群体共同努力构建基础模型、基础算法和工具。这样的大平台将极大地提升整体科研的效率。”


“数百年来,以数据驱动的开普勒范式和以第一性原理驱动的牛顿范式是科学研究的两大基本范式。当下正在蓬勃兴起的 AI for Science 有可能促使两种既有范式的深度融合,激发一场新的科学革命。《达摩院 2022 十大科技趋势》将 AI for Science 列为重要趋势,无疑是看到了人工智能和传统科研结合带来的巨大潜能。我希望它能帮助推动更多科研工作者投身其中,加速这场科学革命的进程。”鄂维南院士表示。


12月28日,阿里巴巴达摩院发布2022十大科技趋势,这是达摩院连续第四年发布前沿科技趋势预测。


通过「定量发散」与「定性收敛」结合的研究方法,达摩院分析了159个领域近三年770万篇公开论文、8.5万份专利,挖掘其中热点领域及重点技术突破,深度访谈近100位科学家,提出了2022年可能照进现实的十大科技趋势,覆盖人工智能、芯片、计算和通信等领域。


这其中,达摩院首先提及的便是AI for Science


AI for Science为何重要?实际上,它是比知识与数据协同范式的影响更为深远的发展方向


如今,AI for Science已经从下游走向上游,也就是从劳动密集的实验数据分析转向智力密集的科学规律发现。这里的科学规律,不仅仅是指已有的,还有全新和未知的。这本就是自然而然的过程,毕竟科学规律其实就是更加凝练的实验数据归纳。而从现象到实验数据再到科学规律,人工智能对科学的影响,就是将整个过程加速了,并扩展到了人类未能触及的边界。在条件充足的领域比如生命科学,这个过程的推进更加迅速。


AI for Science面向“维数灾难”难题,这是智能被抽象出来后要面对的更高阶考验。而另一方面,面向类人智能的大模型发展已进入冷静期,人们不再为动辄万亿参数规模的新模型感到惊讶。在未来,大模型将成为基础知识库般地存在,并对端侧的小模型进行知识迁移,让小模型在此基础上去学习适应垂直环境。可以说,大模型与小模型的协同定义了新的“知识-工程”概念,如同力学工程以经典力学为参考一样,小模型也将以大模型为参照,在具体的、独特的、不确定的场景中发挥作用。


无论是AI for Science还是大小模型协同进化,都预示着知识将被重新定义。


而在知识将被重新定义之前,已有知识和数据智能的协同也在发挥重要作用。这其中,非常典型的发展趋势就包括AI助力绿色能源(比如,精准的电网功率预测)和AI助力高精度医疗导航(比如,癌症的辅助诊疗)。这些变化是源于已有知识的不完备性,也就是知识不能代表真实世界。结合了数据智能之后,技术才能触及真实世界的每一个角落。


而为了让探测的触角能细致入微,不断挖掘新的数据,人们也在持续发明新的感知设备,比如柔性感知机器人。柔性机器人结合柔性电子、力感知与控制、人工智能技术,获得了力觉、视觉、声音等感知能力,应对多任务的通用性与应对环境变化的自适应性大幅提升,其理想目标是减少对世界的预设,也就是对预编程或穷举可能性的依赖。


柔性感知机器人是一种边缘端设备,它在边缘场景中的有效应用,还得依赖于中心知识的初始迁移,这其实正好印证了大小模型协同进化的趋势之必要性和必然性。另一类边缘端设备则在推进人类感官世界的中心化与边缘化的协同,那便是由AR、VR等设备构成的XR互联网。


知识重定义、知识与数据的协同,对应了人类社会的两大步调,也就是凝聚世界规律,和向新大陆进发。支撑这个过程背后的基础设施,是计算和通讯构成的全球互联网。


全球互联网的演进规律和人类社会是同步的,也就是中心化与边缘化同时进行。其中,在通讯层面,星地计算在扩大互联的规模,并走向全球一体化,云网端融合则是随着全球互联的发展而必然出现的重新分工与协同。而在计算层面,面对算力瓶颈以及突破摩尔定律的需求,人们不再执着于突破量子极限,芯片微型化、密集化的瓶颈还可以往能耗层面去考虑。凭借高密度的计算和极低的能耗,硅光芯片有望取代电子芯片,在保留二进制架构的同时,进一步发展摩尔定律,当然,这更多地也是为了适应人工智能的算力需求。


在中心化与边缘化的演进过程中,人类自身不断经受两股力量的推动。每个人都在中心化推力中恐惧被同化,也在边缘化推力中拒绝成为工具。这些心理驱力下衍生的便是对个体完整性的渴求,也就是在数据定义人的时代,对个人信息隐私性的需求。隐私计算在计算效率提高下将演变为全域隐私计算,适逢其时。


综上,达摩院总结出了未来的十大科技趋势,基于知识重定义、知识与数据协同、基础设施、人工智能伦理四个方面列出如下:


知识重定义

  • AI for Science

  • 大小模型协同进化


知识与数据协同

  • 绿色能源AI

  • 高精度医疗导航

  • 柔性感知机器人

  • XR 互联网


基础设施

  • 星地计算

  • 硅光芯片

  • 云网端融合


人工智能伦理

  • 全域隐私计算


知识重定义

AI for Science


人工智能成为科学家的新生产工具,催生科研新范式


实验科学和理论科学是数百年来科学界的两大基础范式,而人工智能正在催生新的科研范式。机器学习能够处理多维、多模态的海量数据,解决复杂场景下的科学难题,带领科学探索抵达过去无法触及的新领域。人工智能不仅将加速科研流程,还将帮助发现新的科学规律。预计未来三年,人工智能将在应用科学中得到普遍应用,在部分基础科学中开始成为科学家的生产工具。


大小模型协同进化


大模型参数竞赛进入冷静期,大小模型将在云边端协同进化


超大规模预训练模型是从弱人工智能向通用人工智能的突破性探索,解决了传统深度学习的应用碎片化难题,但性能与能耗提升不成比例的效率问题限制了参数规模继续扩张。人工智能研究将从大模型参数竞赛走向大小模型的协同进化,大模型向边、端的小模型输出模型能力,小模型负责实际的推理与执行,同时小模型再向大模型反馈算法与执行成效,让大模型的能力持续强化,形成有机循环的智能体系。


知识与数据协同


绿色能源AI


人工智能助力大规模绿色能源消纳,实现多能互补的电力体系


风电、光伏等绿色能源近年来快速发展,也带来了并网难、消纳率低等问题,甚至出现了“弃风”、“弃光”等现象。核心原因在于绿色能源存在波动性、随机性、反调峰等特征,大规模并网可能影响电网的安全稳定运行。人工智能技术的应用,将有效提升电网等能源系统消纳多样化电源和协调多能源的能力,成为提升能源利用率和稳定性的技术支撑,推动碳中和进程。预计未来三年,人工智能技术将帮助电力系统实现大规模绿色能源消纳,实现电力系统的安全、高效、稳定运行。


高精度医疗导航


人工智能与精准医疗深度融合,助力诊疗精度与效率提升


传统医疗依赖医生经验,犹如人工寻路,效果参差不齐。人工智能与精准医疗深度融合,专家经验和新的辅助诊断技术有机结合,将成为临床医学的高精度导航系统,为医生提供自动指引,帮助医疗决策更快更准,实现重大疾病的可量化、可计算、可预测、可防治。预计未来三年,以人为中心的精准医疗将成为主要方向,人工智能将全面渗透在疾病预防和诊疗的各个环节,成为疾病预防和诊疗的高精度导航协同。


柔性感知机器人


机器人将兼具柔性和类人感知,可自适应完成多种任务


传统机器人依赖预编程,局限于大型生产线等结构化场景。近年来,柔性机器人结合柔性电子、力感知与控制、人工智能技术,获得了力觉、视觉、声音等感知能力,应对多任务的通用性与应对环境变化的自适应性大幅提升。机器人将从大规模、标准化的产线走向小规模、非标准化的场景。预计未来五年,柔性感知机器人将逐步替代传统工业机器人,成为产线上的主力设备,并在服务机器人领域开始规模化应用。


XR 互联网


XR 眼镜会成为重要交互界面,带动下一代互联网发展


随着端云协同计算、网络通信、数字孪生等技术发展,以沉浸式体验为核心的 XR(未来虚实融合)互联网将迎来爆发期。眼镜有望成为新的人机交互界面,推动形成有别于平面互联网的 XR 互联网,催生从元器件、设备、操作系统到应用的新产业生态。XR 互联网将重塑数字应用形态,变革娱乐、社交、工作、购物、教育、医疗等场景交互方式。预计未来三年,外形与重量接近普通眼镜的新一代 XR 眼镜将产生,成为下一代互联网的关键入口。


基础设施

星地计算


卫星及地面一体化的通信与计算,促进空天地海全面数字化


基于地面网络和计算的数字化服务局限在人口密集区域,深空、海洋、沙漠等无人区尚是服务的空白地带。高低轨卫星通信和地面移动通信将无缝连接,形成空天地海一体化立体网络。由于算随网动,星地计算将集成卫星系统、空中网络、地面通信和云计算,成为一种新兴的计算架构,扩展数字化服务的空间。预计未来三年,低轨卫星数量会迎来爆发式增长,卫星及其地面系统将成为新型计算节点。


硅光芯片


光电融合兼具光子和电子优势,突破摩尔定律限制


电子芯片的发展逼近摩尔定律极限,难以满足高性能计算不断增长的数据吞吐需求。硅光芯片用光子代替电子进行信息传输,可承载更多信息和传输更远距离,具备高计算密度与低能耗的优势。随着云计算与人工智能的大爆发,硅光芯片迎来技术快速迭代与产业链高速发展。预计未来三年,硅光芯片将承载绝大部分大型数据中心内的高速信息传输。


云网端融合


云网端融合形成新计算体系,催生云上新物种


新型网络技术发展将推动云计算走向云网端融合的新计算体系,并实现云网端的专业分工:云将作为脑,负责集中计算与全局数据处理;网络作为连接,将多种网络形态通过云融合,形成低延时、广覆盖的一张网;端作为交互界面,呈现多元形态,可提供轻薄、长效、沉浸式的极致体验。云网端融合将促进高精度工业仿真、实时工业质检、虚实融合空间等新型应用诞生。预计未来两年,将有大量新型应用在云网端融合的新计算体系中运行。


人工智能伦理


全域隐私计算


破解数据保护与流通两难,隐私计算走向全域数据保护


数据安全保护与数据流通是数字时代的两难问题,破解之道是隐私计算。过去受制于性能瓶颈、技术信任不足、标准不统一等问题,隐私计算尚只能在少量数据的场景下应用。随着专用芯片、加密算法、白盒化、数据信托等技术融合发展,隐私计算有望跨越到海量数据,数据源将扩展到全域,激发数字时代的新生产力。预计未来三年,全域隐私计算技术将在性能和可解释性上有新的突破,或将出现数据信托机构提供基于隐私计算的数据共享服务


—— END ——

登录查看更多
0

相关内容

中国数字经济时代人工智能生态白皮书2021,41页pdf
专知会员服务
71+阅读 · 2022年1月27日
阿里达摩院十大科技趋势报告,31页pdf
专知会员服务
66+阅读 · 2021年12月29日
【Maning新书】数据科学训练营,Data Science Bookcamp,706页pdf
专知会员服务
74+阅读 · 2021年11月19日
人工智能AI中台白皮书(2021年),45页pdf
专知会员服务
284+阅读 · 2021年9月18日
【干货书】计算机科学,647页pdf,Computer Science
专知会员服务
45+阅读 · 2021年5月10日
你真的了解计算生物学和AI for Science吗?
微软研究院AI头条
0+阅读 · 2022年2月22日
来聊聊计算生物学和AI for Science|量子位 x 微软亚洲研究院
微软研究院AI头条
0+阅读 · 2022年1月25日
阿里达摩院十大科技趋势报告,31页pdf
专知
0+阅读 · 2021年12月29日
阿里达摩院发布2022十大科技趋势
THU数据派
0+阅读 · 2021年12月28日
国家自然科学基金
7+阅读 · 2017年12月31日
国家自然科学基金
7+阅读 · 2017年12月31日
国家自然科学基金
15+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
1+阅读 · 2022年4月18日
Arxiv
28+阅读 · 2021年10月1日
Arxiv
22+阅读 · 2019年11月24日
Domain Representation for Knowledge Graph Embedding
Arxiv
14+阅读 · 2019年9月11日
VIP会员
相关基金
国家自然科学基金
7+阅读 · 2017年12月31日
国家自然科学基金
7+阅读 · 2017年12月31日
国家自然科学基金
15+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
相关论文
Top
微信扫码咨询专知VIP会员