人工智能(AI)有可能为研究人员提供加速科学发现和技术进步的工具,从而彻底改变应对人类最紧迫挑战的能力。生成式人工智能可以在庞大的数据集和大量计算的基础上创建内容,其变革性尤为明显。生成式人工智能的例子包括大型语言模型、图像生成模型和生成式科学模型。拜登总统在 2023 年 10 月 30 日发布的《关于安全、可靠地开发和使用人工智能的综合行政命令》中,责成 PCAST 报告 "人工智能......在旨在应对重大社会和全球挑战的研究中的潜在作用"。

通过精心设计、公平共享和负责任地使用基础设施,人工智能将使科学家能够应对紧迫的挑战,包括改善人类健康和加强气候变化时期的天气预测。人工智能可以帮助探索长期存在的科学奥秘,激发和拓展人类的创造力,例如揭开宇宙的起源和进化。人工智能还将帮助研究人员满足国家的持续需求,从加速半导体芯片设计到发现新材料以满足能源需求。此外,人工智能正开始消除使科学研究变得缓慢和昂贵的障碍,例如,它提供了快速确定最佳候选药物的方法(从而减少了昂贵的实验室试验数量),帮助优化实验设计,并比人工或使用传统数据科学方法更有效地发现数据中的联系。如果基础人工智能资源、经过验证的数据以及科学工具和培训能够被广泛获取,人工智能技术就有可能实现科学知识的大众化,将相互关联的技术概念带给更多的人,使不同的研究人员能够将他们的专业知识和观点用于应对社会和全球挑战。

与任何其他新工具或技术一样,要实现人工智能的潜力,就必须解决其局限性。这些问题包括:误导性或不正确的结果、偏见或不公平的长期存在以及模型训练数据中蕴含的模式所产生的抽样误差、获取高质量训练数据的途径有限、保护知识产权和隐私所面临的挑战、训练或部署模型或运行人工智能算法所需的大量精力,以及坏人或邪恶行为者出于恶意目的使用现成人工智能工具的风险。许多解决这些问题的公共和私营部门活动已经在进行中,包括政府根据 2023 年 10 月的人工智能行政命令所做的努力。可重复性和验证是科学诚信和科学方法的关键原则,在发展负责任地使用人工智能和对人工智能应用进行专业人工监管的文化时,必须继续高度重视。

人工智能有可能改变每一个科学学科以及进行科学研究的方式的许多方面。科学家们已经在利用人工智能创造目前还不知道如何设计的新型功能材料,其中包括超导体和热电材料,它们不仅能提高能源效率,还能减少碳足迹。同样,人工智能模型正在帮助研究人员为制造工艺和产品进行新的设计,并开发新的药物疗法,从而在未来实现对特定癌症和病毒的个体化治疗。人工智能模型还在帮助工程师设计半导体芯片,以更少的人力和时间做出更好的设计。在医疗保健领域,人工智能技术正在创造新的方法来分析广泛的医疗数据,用于疾病的早期诊断,以便及时干预和发现医疗失误。PCAST 还预测,人工智能将广泛提供针对特定个人和疾病过程的超个性化医疗服务,其中包括详细的病史、遗传信息和信号,如健康和不健康细胞的行为方式。

人工智能还通过改进科学模型来改变科学。在气候科学领域,人工智能模型正开始加强天气预测,并推进水资源管理、温室气体监测和灾难影响预测的全地球模型。科学家们已经利用人工智能成功预测了蛋白质的结构;新的基础模型将揭开细胞生物学的更多秘密,并为细胞内相互作用的计算机模拟提供动力,这些模拟可用于探索新疗法。人工智能模型有望帮助了解宇宙的起源,能够通过快速模拟测试众多宇宙学假设。这种人工智能建模甚至可以帮助科学家发现新的物理定律。

人工智能将使社会科学取得前所未有的进步,用新的定量技术补充定性方法,分析现有数据,开发和分析更新类型的数据,如智能手机上的步数、经许可从搜索和浏览中提取的匿名数据或社交媒体上发布的图像。人工智能可以为使用庞大数据集的研究提供更多动力,例如联邦统计机构长期以来收集和整理的数据集--最好辅以私营部门掌握的数据集--作为设计有效联邦政策的输入。将人工智能应用于这些历史悠久的和较新的社会科学数据集,可以促进更有效、反应更迅速、更公平的数据驱动型决策和服务的提供。

以上几个人工智能辅助研究的例子说明,通过负责任地使用人工智能技术,人类科学家将有能力实现变革性的发现。此外,PCAST 还希望,负责任地共享基础人工智能资源将有助于科学大众化,并应对重大的社会和全球挑战。

在全球范围内,将人工智能用于科学和技术研究的速度正在迅速加快,因此需要致力于在这一强大的新工具的应用方面发挥美国的领导作用。在拜登政府所做工作的基础上,美国必须大胆而深思熟虑地采取行动,以保持在研究、人工智能的创新应用以及为安全和负责任地使用人工智能建立框架和规范方面的领先地位。在本报告中,PCAST 提出了五项具体的研究成果和行动建议,这将有助于美国充分利用人工智能的潜力。

建议概要

  • 建议 1:扩大现有工作,广泛共享基础人工智能资源。

广泛支持可广泛访问的共享模型、数据集、基准和计算资源,对于确保学术研究人员、国家和联邦实验室、小型公司和非营利组织利用人工智能为国家创造效益至关重要。在美国,这方面最有希望的努力是国家人工智能研究资源(NAIRR),该资源目前是一个试点项目。PCAST 建议尽快将 NAIRR 试点项目扩大到 NAIRR 特别工作组所设想的规模,并为其提供充足资金。全面的 NAIRR,连同联邦和州一级的行业伙伴关系和其他人工智能基础设施努力,可作为国家或国际一级人工智能基础设施项目的垫脚石,以促进高影响力的研究。

  • 建议 2:扩大对联邦数据集的安全访问,以满足经批准的关键研究需求,并提供适当的保护和保障措施。

允许经批准的研究人员有限、安全地访问联邦数据集,并允许向诸如 NAIRR 这样的资源中心发布经过仔细匿名处理的此类数据集,这样做的好处是巨大的。PCAST 极力鼓励扩大现有的安全数据访问试点计划,并制定联邦数据库管理指南,将现有的尖端隐私保护技术纳入其中。利用现代人工智能技术实现此类数据集整理工作自动化的潜力巨大。PCAST 鼓励将使用人工智能改进数据整理作为联邦数据共享计划(如 data.gov)的长期目标。

PCAST 支持联邦机构要求对其资助或开展的研究中产生的数据集进行负责任的共享。鼓励进一步执行此类任务,包括共享在联邦资助的研究数据基础上训练的人工智能模型,同时提供充足的资源来支持所需的行动。

  • 建议 3:支持人工智能领域的基础研究和应用研究,这些研究涉及学术界、产业界、国家和联邦实验室以及联邦机构之间的合作,正如 NAIRR 工作组为 NAIRR 制定的愿景所概述的。

联邦政府资助的学术研究与私营部门研究之间的界限并不清晰。许多研究人员游走于学术机构、非营利组织和/或私营公司之间,而目前所有人工智能研发(R&D)中的很大一部分是由私营公司支持的。要充分利用人工智能对科学的潜在益处,就必须支持涉及各种有前景、有成果的假设和方法的研究。这可能需要资助机构在如何与产业界合作以及哪些研究人员可以得到支持方面放宽姿态,以促进创新研究工作和不同部门之间的合作。此类合作的例子可包括从多个来源创建高质量的公共科学数据集或创建多模式基础模型。

  • 建议 4:在科学研究过程的所有阶段采用负责任、透明和可信的人工智能使用原则。

应在研究项目的初始阶段就对人工智能的科学使用所产生的不准确、有偏见、有害或不可复制的研究结果的风险进行管理,而不是事后才考虑。PCAST 建议联邦资助机构考虑更新其负责任的研究行为指南,要求研究人员制定负责任地使用人工智能的计划。这些计划应包括机构办公室和委员会推荐的最佳实践,以应对潜在的人工智能相关风险,并说明使用任何自动化流程的监督程序。为了最大限度地减少研究人员的额外行政负担并建立负责任的文化,在列举主要风险之后,各机构应提供风险缓解的示范流程。

与此同时,美国国家科学基金会(NSF)和国家标准与技术研究院(NIST)等机构应继续支持负责任和可信赖的人工智能科学基础研究。这项研究应包括制定标准基准来衡量人工智能模型的特性,如准确性、可重复性、公平性、弹性和可解释的人工智能,以及监测自身这些特性的人工智能算法,并在基准不符合规定规范时进行调整。此类研究的另一个目标应该是开发工具,以评估数据集的偏差,并区分合成数据与真实世界的数据。

  • 建议 5:鼓励采用创新方法,将人工智能辅助工具融入科学工作流程。

科学组织实体是一个极好的 "沙盒",可以在其中实践、研究和评估人类与人工智能助手之间合作的新模式。目标不应该是最大限度地提高自动化程度,而是让人类研究人员在负责任地利用人工智能辅助工具的同时,实现高质量的科学研究。

资助机构应认识到这些新工作流程的出现,并设计灵活的程序、衡量标准、资助模式和挑战问题,鼓励战略性地尝试新的人工智能辅助方式来组织和执行科学项目。这些工作流程的实施也为各种学科的研究人员提供了机会,如人为因素、工业和组织心理学等,以促进在人机协作领域的知识。

更广泛地说,资助机构、学术界和学术出版业的激励结构可能需要更新,以支持更广泛的科学贡献,如策划高质量和广泛可用的数据集,而传统的研究生产力指标可能无法充分认可这些贡献。

图 1. 负责任地使用、共享资源和增强能力的良性循环,以利用人工智能加速科学研究。本报告从多个方面探讨了这种相互作用。

成为VIP会员查看完整内容
24

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
《未来战争与人工智能:可见之路》52页报告
专知会员服务
78+阅读 · 5月12日
《计算力与人工智能治理》2024最新104页报告
专知会员服务
44+阅读 · 2月29日
【硬核书】迁移学习多智能体强化学习系统,131页pdf
专知会员服务
143+阅读 · 2022年7月8日
【硬核书】终身机器学习,145页pdf
专知会员服务
83+阅读 · 2021年3月1日
多模态深度学习综述,18页pdf
专知
48+阅读 · 2020年3月29日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
38+阅读 · 2015年12月31日
国家自然科学基金
27+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
41+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
A Survey of Large Language Models
Arxiv
408+阅读 · 2023年3月31日
Arxiv
21+阅读 · 2023年3月17日
Arxiv
10+阅读 · 2020年11月26日
Arxiv
11+阅读 · 2018年7月31日
VIP会员
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
38+阅读 · 2015年12月31日
国家自然科学基金
27+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
41+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员