人工智能(AI)是一个创新的引擎,正在推动科学发现和经济增长。它正日益成为解决方案的一个组成部分,这些解决方案将影响到从日常例行任务到社会层面的挑战,最终服务于公共利益。同时,也有人担心人工智能可能会产生负面的社会和环境后果。为了实现人工智能的积极和变革潜力,必须利用美国所有的聪明才智,以解决社会挑战的方式推进该领域,为所有美国人服务,并维护民主价值观。
然而,目前人工智能前沿的进展往往与获得大量的计算能力和数据有关。今天,这种机会往往仅限于那些资源丰富的组织。这种巨大且不断扩大的资源鸿沟有可能限制和不利于人工智能研究生态系统。这种不平衡威胁着国家培养人工智能研究社区和劳动力的能力,以反映美国丰富的多样性和利用人工智能来推动公共利益的能力。
如本报告所述,一个可广泛使用的人工智能研究网络基础设施,汇集了计算资源、数据、测试平台、算法、软件、服务、网络和专业知识,将有助于使美国的人工智能研究和开发(R&D)景观民主化,使所有人受益。它将有助于创造途径,扩大参与人工智能的研究人员的范围,并使人工智能的方法和应用增长和多样化。这种网络基础设施也有助于为所有科学领域和学科的进步开辟新的机会,包括在人工智能审计、测试和评估、可信的人工智能、减少偏见和人工智能安全等关键领域。反过来,更多的机会和多样化的视角可以带来新的想法,否则就不会实现,并为开发设计上具有包容性的人工智能系统创造条件。
作为《2020年国家人工智能倡议法》的一部分,国会成立了国家人工智能研究资源(NAIRR)工作组,以 "调查 "NAIRR作为国家人工智能研究网络基础设施的可行性和可取性,并 "提出详细说明[如何建立和维持NAIRR]的路线图。" 最近的《2022年CHIPS和科学法案》加强了民主化使用国家人工智能研究网络基础设施的重要性,通过投资加速先进计算的发展--从下一代图形处理单元到高密度内存芯片--以及采取措施积极吸引广泛和多样化的美国人才参与前沿科学和工程,包括人工智能。
这份最终报告是特别工作组历时18个月,为建立NAIRR制定愿景和实施计划的最终成果。它建立在工作组2022年5月发布的临时报告中的调查结果和建议的基础上,提供了一个实现NAIRR目标的实施计划:以保护隐私、公民权利和公民自由的方式,加强美国的人工智能创新生态系统并使之民主化。
NAIRR的建立应考虑到四个可衡量的目标,即(1)刺激创新,(2)增加人才的多样性,(3)提高能力,以及(4)推进值得信赖的人工智能。NAIRR应该通过支持来自不同背景的研究人员和学生的需求来实现这些目标,这些研究人员和学生正在从事基础性的、受使用启发的和转化性的人工智能研究。这些用户应以美国为基地或隶属于美国的组织,包括学术机构、非营利组织和初创企业或小型企业。
NAIRR应包括一套来自不同供应商的计算、数据、测试平台和软件资源,以及技术支持和培训,以满足这一目标用户群的需求。NAIRR的具体设计、实施和评估应围绕四个关键目标进行,并应支持收集数据以评估系统性能的关键指标和实现这些目标的成功。
NAIRR的管理和治理应遵循合作管理模式,即由一个联邦机构作为NAIRR运作的管理机构,由联邦机构的负责人组成的指导委员会负责推动NAIRR的战略方向。行政机构内的项目管理办公室应该为一个独立的运营实体提供资金和监督,以管理NAIRR的日常运营。由国家人工智能倡议办公室(NAIIO)共同主持的指导委员会将在NAIRR的管理中纳入联邦各机构的利益和观点。这些机构也应直接支持资源提供者,他们的资源联合起来将构成NAIRR。应通过用户委员会、科学咨询委员会、技术咨询委员会和道德咨询委员会向运营实体提供建议,挖掘多样化的观点和专业知识,为NAIRR的运营提供信息。
NAIRR应通过一个综合门户网站提供计算和数据资源、测试平台、软件和测试工具以及用户支持服务的联合组合。计算资源应包括传统服务器、计算集群、高性能计算和云计算,并应支持访问边缘计算资源和人工智能研发的测试平台。开放的和受保护的数据应在分层访问协议下提供,并与计算资源共处一地。运营实体本身不应操作构成NAIRR的全部计算机硬件;相反,计算以及数据、测试和培训资源应作为服务由通过联邦机构或多机构资助机会选择的合作伙伴资源提供者提供。当全面实施时,NAIRR应同时满足人工智能研究界的能力(支持大量用户的能力)和能力(训练资源密集型人工智能模型的能力)需求
NAIRR必须能被各种用户广泛使用,并提供一个可用于教育和社区建设活动的平台,以降低参与人工智能研究生态系统的障碍,增加人工智能研究人员的多样性。NAIRR的访问门户和公共网站应提供目录以及搜索和发现工具,以促进对数据、测试平台以及为各种经验水平服务的教育和培训资源的访问。
NAIRR应该通过设计和实施其管理程序,为负责任的人工智能研究设定标准。NAIRR必须从一开始就通过整合适当的技术控制、政策和治理机制,积极主动地解决隐私、民权和公民自由问题。运营实体应与道德咨询委员会合作,制定标准和机制,从隐私、民权和公民自由的角度评估拟纳入NAIRR的研究和资源。应根据白宫科技政策办公室在2022年10月发布的《人工智能权利法案蓝图》,要求定期培训,以建立NAIRR用户对人工智能研究中与隐私、民权和公民自由有关的权利、责任和最佳做法的认识。
NAIRR应根据既定的指导方针实施系统保障措施。这些准则包括美国国家标准与技术研究所(NIST)制定的准则和五个安全框架:安全项目、安全人员、安全设置、安全数据和安全产出。运营实体应将NAIRR网络基础设施设计成由多个层次组成,首先是两个主要区域:一个开放的科学区域 "NAIRR-开放 "和一个安全区域 "NAIRR-安全"。每个区域都应该联合计算、网络和数据资源,按照安全和访问控制政策运行,这些政策在区域内是统一的,但在区域之间是不同的,反映了用户和资源运营商的不同优先级和需求。NAIRR-Open应采用开放科学界20多年来形成的最佳做法;与联邦开放数据、开放政府和研究安全政策保持一致;使用单点登录认证和运营实体管理的资源分配机制管理访问。NAIRR-Secure应该由一个或多个安全飞地组成,遵守一套共同的安全控制,并有能力支持受法律保护的数据所产生的安全要求。
NAIRR的实施应分四个阶段,在本报告发表后立即开始。在第一阶段,国会应授权并拨款建立NAIRR。行政机构和NAIIO应该协调指导委员会的成立,并建立一个项目管理办公室,然后准备对运营实体的招标,并管理选择过程。
图:阶段性NAIRR实施时间表
在第二阶段,运营实体应确立其活动,并监督NAIRR门户网站和用户界面的创建,建立适当的技术和政策控制。该架构应支持收集关键绩效指标,以评估NAIRR的进展。资源提供者应通过协调的、多机构的筹资机会来选择,最好是在运营实体最初授予的6个月内发布。
在第三阶段,NAIRR应达到初步的运作能力,运营实体也应正式确定政策、程序和初步的技术资源,提供给人工智能研究人员。最初的能力包括:(1)一个门户网站和用户支持资源;(2)一个混合的计算资源提供者;(3)一个分配和身份系统;(4)一个数据发布系统。在第四阶段,活动应从建立NAIRR过渡到建立稳定的运作,以及根据用户的吸收和需求对NAIRR资源进行计划的演变。
最后,工作组还提出了一个实施NAIRR的试点方案,该方案将与上述阶段同时启动,以加快向人工智能研发界提供NAIRR资源。
按照设想,NAIRR的影响将是巨大而深远的,使研究人员能够解决从常规任务到全球挑战的各种问题。为了实现其愿景和目标,特别工作组估计NAIRR的预算在最初的六年期间为26亿美元。这笔投资的大部分(22.5亿美元)用于资助通过NAIRR获得的资源,通过向多个联邦机构拨款。工作小组根据先进的计算资源以及数据、培训和软件资源的近期成本、满足人工智能研发界当前需求的使用水平估计,以及人工智能研发界的预期增长来估计这一预算。资源提供者应每两年上线一次,使用寿命为六年,这样每两年就会有7.5亿美元的新投资,以确保NAIRR的资源保持最先进的水平。运营实体每年将需要5500万至6500万美元来支持NAIRR活动的协调和管理。每年还有500万美元的预算用于对运营实体和NAIRR绩效的外部评估。
本报告中提出的NAIRR的愿景旨在满足国家对增加获得最先进的资源的需求,以推动人工智能创新。实现这一愿景的路线图建立在现有的联邦投资之上;设计了对隐私、民权和公民自由的保护;并促进了多样性和公平的使用。如果成功,国家人工智能研究资源将改变美国国家人工智能研究生态系统,并通过加强和民主化参与美国的基础性、使用性和转化性人工智能研发,促进解决社会层面问题的能力。