《管理两用基础模型的误用风险》最新69页报告 - 专知VIP

会员服务 ·

6

AI与军事 · 基础模型 ·

《管理两用基础模型的误用风险》最新69页报告

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

本文源自美国人工智能安全研究所。本文件为提高两用基础模型（以下简称 “基础模型”）的安全性、保障性和可信性提供了自愿性指南，与《国家人工智能倡议法》、第 14110 号行政命令和 2024 年 10 月 24 日关于人工智能的总统国家安全备忘录保持一致。具体来说，它侧重于管理此类模型被故意滥用以对公共安全或国家安全造成危害的风险。基础模型被滥用的方式仍在不断演变，但可能出现的情况包括：利用模型促进化学、生物、放射性或核武器的开发；发动攻击性网络攻击；生成有害或危险的内容，如未经同意的真实个人亲密图像（NCII）。

基础模型的快速发展为了解其能力和误用风险带来了巨大挑战，本文件为识别、衡量和减轻整个人工智能生命周期中的这些风险提供了依据。误用风险并不只是模型本身的功能--它们部分源于恶意行为者的动机、资源和限制，以及模型集成到应用程序和社会危害防御措施中的方式。因此，本文提供的指南既涉及这些风险的技术方面，也涉及更广泛的社会方面。

本文件确定了预测、测量和减轻基础模型误用风险的程序和框架，并就组织如何提供风险管理实践的透明度提出了建议。本文件尤其关注基础模型的初始开发者，但整个人工智能供应链中的其他参与者也在管理误用风险方面发挥作用，第 3 节对此进行了更详细的介绍。

成为VIP会员查看完整内容

11

相关内容

AI与军事

人工智能在军事中可用于多项任务，例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。

《云计算与国际安全：风险、机遇和治理挑战》最新35页报告

《云计算与国际安全：风险、机遇和治理挑战》最新35页报告

专知会员服务

28+阅读 · 2024年12月25日

《加强技术系统中的异常检测：利用非侵入式负载监控和先进机器学习技术》最新95页

《加强技术系统中的异常检测：利用非侵入式负载监控和先进机器学习技术》最新95页

专知会员服务

20+阅读 · 2024年10月23日

《人工智能与战略决策：人工智能赋能情报中的沟通信任与不确定性》最新42页智库报告

《人工智能与战略决策：人工智能赋能情报中的沟通信任与不确定性》最新42页智库报告

专知会员服务

63+阅读 · 2024年6月29日

《新兴技术与风险分析：人工智能与关键基础设施》最新报告

《新兴技术与风险分析：人工智能与关键基础设施》最新报告

专知会员服务

56+阅读 · 2024年4月2日

《人工智能与国际安全：理解风险并为建立信任措施铺平道路》最新65页报告

《人工智能与国际安全：理解风险并为建立信任措施铺平道路》最新65页报告

专知会员服务

25+阅读 · 2024年1月14日

《人工智能灾难性风险概述》2023最新55页报告

《人工智能灾难性风险概述》2023最新55页报告

专知会员服务

67+阅读 · 2023年10月6日

《用于跟踪美国防部（DoD）预算支出的区块链数据结构》23页报告

《用于跟踪美国防部（DoD）预算支出的区块链数据结构》23页报告

专知会员服务

32+阅读 · 2023年8月10日

【DARPA支持】《合成测试环境中的人机协作和通信方法》2022最新25页slides

【DARPA支持】《合成测试环境中的人机协作和通信方法》2022最新25页slides

专知会员服务

34+阅读 · 2022年12月1日

美国人工智能国家安全委员会发布最终报告, 130页pdf

美国人工智能国家安全委员会发布最终报告, 130页pdf

专知会员服务

145+阅读 · 2021年3月2日

最新《数据因果性学习: 问题与方法》2020综述论文，36页pdf

最新《数据因果性学习: 问题与方法》2020综述论文，36页pdf

专知会员服务

154+阅读 · 2020年8月16日

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

专知

57+阅读 · 2023年4月6日

【2022新书】深度学习归一化技术，117页pdf

【2022新书】深度学习归一化技术，117页pdf

专知

28+阅读 · 2022年11月25日

【2022 新版书籍】第2版《可解释的机器学习：黑盒模型可解释性理解指南》，330页pdf

【2022 新版书籍】第2版《可解释的机器学习：黑盒模型可解释性理解指南》，330页pdf

专知

11+阅读 · 2022年11月9日

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

专知

46+阅读 · 2022年11月5日

【干货书】优化算法，232页pdf

【干货书】优化算法，232页pdf

专知

26+阅读 · 2022年9月8日

【2022新书】应用深度学习：工具、技术与实现，355页pdf

【2022新书】应用深度学习：工具、技术与实现，355页pdf

专知

42+阅读 · 2022年7月26日

【2022新书】工业4.0进展：概念与应用，248页pdf

【2022新书】工业4.0进展：概念与应用，248页pdf

专知

18+阅读 · 2022年7月9日

智能合约的形式化验证方法研究综述

智能合约的形式化验证方法研究综述

专知

16+阅读 · 2021年5月8日

事件知识图谱构建研究进展与趋势

事件知识图谱构建研究进展与趋势

THU数据派

99+阅读 · 2019年12月11日

使用深度学习构建先进推荐系统：近期33篇重要研究概述

使用深度学习构建先进推荐系统：近期33篇重要研究概述

机器之心

20+阅读 · 2017年12月23日

投资者有限关注与证券市场监管：基于大数据和计算实验的方法

国家自然科学基金

0+阅读 · 2015年12月31日

云计算环境下属性基密码及其应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

多类秘书问题的最优算法设计及竞争比分析

国家自然科学基金

0+阅读 · 2015年12月31日

基于非对称群体兴趣相关性并融合情境与群体信任的Web服务推荐研究

国家自然科学基金

1+阅读 · 2015年12月31日

天气影响下基于损失厌恶的“公司+农户”型农产品供应链风险管理研究

国家自然科学基金

1+阅读 · 2015年12月31日

不确定环境下具有稀疏特征的鲁棒投资组合选择问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

可证明的网络和数据匿名性及隐私增强身份管理关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

企业内正式与非正式网络互动及其对组织适应性影响和权变机理研究：CAS视角的分析

国家自然科学基金

1+阅读 · 2014年12月31日

残缺判断信息下专家共识群决策理论、方法及应用研究

国家自然科学基金

2+阅读 · 2014年12月31日

外包与云计算情境下IT业务匹配研究：适应性结构化理论视角

国家自然科学基金

2+阅读 · 2014年12月31日

Experimental relativistic zero-knowledge proofs with unconditional security

Arxiv

0+阅读 · 1月30日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

84+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

484+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

150+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

62+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

79+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

175+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

25+阅读 · 2023年3月17日

VIP会员

相关主题

相关VIP内容

《云计算与国际安全：风险、机遇和治理挑战》最新35页报告

《云计算与国际安全：风险、机遇和治理挑战》最新35页报告

专知会员服务

28+阅读 · 2024年12月25日

《加强技术系统中的异常检测：利用非侵入式负载监控和先进机器学习技术》最新95页

《加强技术系统中的异常检测：利用非侵入式负载监控和先进机器学习技术》最新95页

专知会员服务

20+阅读 · 2024年10月23日

《人工智能与战略决策：人工智能赋能情报中的沟通信任与不确定性》最新42页智库报告

《人工智能与战略决策：人工智能赋能情报中的沟通信任与不确定性》最新42页智库报告

专知会员服务

63+阅读 · 2024年6月29日

《新兴技术与风险分析：人工智能与关键基础设施》最新报告

《新兴技术与风险分析：人工智能与关键基础设施》最新报告

专知会员服务

56+阅读 · 2024年4月2日

《人工智能与国际安全：理解风险并为建立信任措施铺平道路》最新65页报告

《人工智能与国际安全：理解风险并为建立信任措施铺平道路》最新65页报告

专知会员服务

25+阅读 · 2024年1月14日

《人工智能灾难性风险概述》2023最新55页报告

《人工智能灾难性风险概述》2023最新55页报告

专知会员服务

67+阅读 · 2023年10月6日

《用于跟踪美国防部（DoD）预算支出的区块链数据结构》23页报告

《用于跟踪美国防部（DoD）预算支出的区块链数据结构》23页报告

专知会员服务

32+阅读 · 2023年8月10日

【DARPA支持】《合成测试环境中的人机协作和通信方法》2022最新25页slides

【DARPA支持】《合成测试环境中的人机协作和通信方法》2022最新25页slides

专知会员服务

34+阅读 · 2022年12月1日

美国人工智能国家安全委员会发布最终报告, 130页pdf

美国人工智能国家安全委员会发布最终报告, 130页pdf

专知会员服务

145+阅读 · 2021年3月2日

最新《数据因果性学习: 问题与方法》2020综述论文，36页pdf

最新《数据因果性学习: 问题与方法》2020综述论文，36页pdf

专知会员服务

154+阅读 · 2020年8月16日

热门VIP内容

开通专知VIP会员享更多权益服务

《分析与预测陆军战斗体能测试表现：统计与机器学习方法》2025最新137页

《军事行动中的人机协同共同学习》2025最新文献

代理式人工智能时代的决策优势

《F/A-18机队替换中队仿真模型的设计与分析》2025最新73页

相关资讯

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

专知

57+阅读 · 2023年4月6日

【2022新书】深度学习归一化技术，117页pdf

【2022新书】深度学习归一化技术，117页pdf

专知

28+阅读 · 2022年11月25日

【2022 新版书籍】第2版《可解释的机器学习：黑盒模型可解释性理解指南》，330页pdf

【2022 新版书籍】第2版《可解释的机器学习：黑盒模型可解释性理解指南》，330页pdf

专知

11+阅读 · 2022年11月9日

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

专知

46+阅读 · 2022年11月5日

【干货书】优化算法，232页pdf

【干货书】优化算法，232页pdf

专知

26+阅读 · 2022年9月8日

【2022新书】应用深度学习：工具、技术与实现，355页pdf

【2022新书】应用深度学习：工具、技术与实现，355页pdf

专知

42+阅读 · 2022年7月26日

【2022新书】工业4.0进展：概念与应用，248页pdf

【2022新书】工业4.0进展：概念与应用，248页pdf

专知

18+阅读 · 2022年7月9日

智能合约的形式化验证方法研究综述

智能合约的形式化验证方法研究综述

专知

16+阅读 · 2021年5月8日

事件知识图谱构建研究进展与趋势

事件知识图谱构建研究进展与趋势

THU数据派

99+阅读 · 2019年12月11日

使用深度学习构建先进推荐系统：近期33篇重要研究概述

使用深度学习构建先进推荐系统：近期33篇重要研究概述

机器之心

20+阅读 · 2017年12月23日

相关基金

投资者有限关注与证券市场监管：基于大数据和计算实验的方法

国家自然科学基金

0+阅读 · 2015年12月31日

云计算环境下属性基密码及其应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

多类秘书问题的最优算法设计及竞争比分析

国家自然科学基金

0+阅读 · 2015年12月31日

基于非对称群体兴趣相关性并融合情境与群体信任的Web服务推荐研究

国家自然科学基金

1+阅读 · 2015年12月31日

天气影响下基于损失厌恶的“公司+农户”型农产品供应链风险管理研究

国家自然科学基金

1+阅读 · 2015年12月31日

不确定环境下具有稀疏特征的鲁棒投资组合选择问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

可证明的网络和数据匿名性及隐私增强身份管理关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

企业内正式与非正式网络互动及其对组织适应性影响和权变机理研究：CAS视角的分析

国家自然科学基金

1+阅读 · 2014年12月31日

残缺判断信息下专家共识群决策理论、方法及应用研究

国家自然科学基金

2+阅读 · 2014年12月31日

外包与云计算情境下IT业务匹配研究：适应性结构化理论视角

国家自然科学基金

2+阅读 · 2014年12月31日

相关论文

Experimental relativistic zero-knowledge proofs with unconditional security

Arxiv

0+阅读 · 1月30日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

84+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

484+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

150+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

62+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

79+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

175+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

25+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员