数据基础设施是许多大型国家和国际项目与合作的核心推动因素。在主要实验和观测研究设施的研究数据规模和复杂性呈指数级增长的同时,计算和数据技术也在快速发展,使研究数据的访问、互联、交互和分析变得更加容易。国家人工智能研究资源和国家战略计算储备等重大联邦倡议,以及开放科学和公众访问的联邦目标,都要求在科学数据和基础设施方面进行更高层次的协调。因此,研发基础设施(RDI)数据基础设施从业人员、RDI 管理人员和联邦赞助商在规划、部署和运营数据系统和服务时面临着挑战,这些系统和服务必须能够跟上不断发展的科学需求和技术进步的步伐。需要解决的变数很多,而且由于 RDI 通常是独立开发的,因此所产生的数据解决方案可能彼此大相径庭--这可能会阻碍更广泛的互操作性。
本报告旨在提高人们对全面规划 RDI 数据基础设施重要性的认识。本报告以共同框架的形式提供了一种可操作的方法,其中包含从业人员、管理人员和赞助商在规划、开发、运营和升级数据基础设施和互联性时应提出的关键问题(见下文摘要框)。本报告进一步确定了当前 RDI 数据基础设施的交叉挑战领域,这些领域将受益于联邦和社区的集体讨论和行动。最终目的是促进在 RDI 数据和基础设施的共享和互操作性方面的合作与协作,从而最大限度地提高美国科学事业的整体科学影响和效益。
数据的科学目标和任务优先级
用户和利用
数据清单、管理和监护
动态数据生态系统
项目管理与合作