RAI 工具包的生成式人工智能版本通过提供具体的问题和工具,将生成式人工智能指南付诸实施,使生成式人工智能(GenAI)项目负责人能够确保负责任地安全设计、开发、部署和使用这项新技术。本指南的结构和大部分内容与 2023 年 11 月发布的 RAI 工具包 MVP 相同,并根据 RAI 团队在这一年中收到的反馈进行了一些更新。在适当的地方,它包含了新的或经过修改的内容,以解决 GenAI 特有的问题和风险。
特别值得注意的是加入了一个新工具,即 “适宜性、可行性和可商榷性评估”。附录 11 中的评估源于《关于生成式人工智能和大型语言模型的指南报告》(2024 年 4 月),为用户提供了一个简单的问卷,以确定 GenAI 是否是满足其业务需求的正确技术。使用该工具作为预选装置,人工智能项目团队可以避免在其他成本较低的人工智能或分析技术被证明同样有效(甚至更有效)的情况下,浪费时间和资源来追求 GenAI 解决方案。
该工具包旨在作为一种技术资源,为每个组件自身的治理流程提供支持。根据与特定项目用例相关的风险以及特定组件的指导方针和要求,用户可以自由选择本工具包中与用户最相关的部分。例如,对于低风险或试验性用例,可以跳过工具包中的许多项目。无论具体用例如何,建议使用的项目都标有 [Gate] 标记。
工具包在产品开发生命周期的每个阶段都按顺序进行。与《指南与警戒线》特定部分相关的项目用脚注突出显示如下: 对齐: 第 3D 节 - 护栏: 数据合规性。这些脚注指出了《指南与护栏》中与该项目相关的部分(即本例中的第 3D 部分)。
工具包的每个项目也可在更新后的 RAI 工具包网络应用程序中找到,其中有可用工具的链接以及每个项目的分类标签。GenAI 版 RAI 工具包是一份动态文件,将定期更新。
阶段 1. 接收
1.1 考虑以往的经验教训
1.2 确定相关法律、道德框架和政策
1.3 确定利益相关者并让他们参与进来
1.4 具体化人工智能用例
1.5 决定进入构思阶段
阶段 2. 构思
2.1 确定需求
2.2 确定风险和机遇/权衡利弊
2.2 权衡和权衡道德标准
2.3 撰写伦理关注声明
2.4 设计以减轻道德/风险负担
2.5 问责制、责任、访问流和治理
阶段 3. 评估
3.1 评估需求、关注声明、缓解措施和衡量标准
3.2 探索性数据分析
3.3 更新人工智能适用性、可行性和可取性评估
3.4 更新文件
阶段 4. 开发/采购
4.1 利用人工智能促进保证
4.2 更新文件
阶段 5. TEVV
5.1 测试系统的稳健性、弹性和可靠性
5.2 更新文档
阶段 6. 集成与部署
6.1 运行测试
6.2 培训用户
6.3 建立事件响应程序
6.4 审计和监督机制
6.5 更新文档
阶段 7. 使用
7.1 对系统及其使用、环境和生态系统进行持续监控
7.2 确保更新和再培训
7.3 制定系统退役计划
7.4 记录经验教训