Security risks from AI have motivated calls for international agreements that guardrail the technology. However, even if states could agree on what rules to set on AI, the problem of verifying compliance might make these agreements infeasible. To help clarify the difficulty of verifying agreements on AI$\unicode{x2013}$and identify actions that might reduce this difficulty$\unicode{x2013}$this report examines the case study of verification in nuclear arms control. We review the implementation, track records, and politics of verification across three types of nuclear arms control agreements. Then, we consider implications for the case of AI, especially AI development that relies on thousands of highly specialized chips. In this context, the case study suggests that, with certain preparations, the foreseeable challenges of verification would be reduced to levels that were successfully managed in nuclear arms control. To avoid even worse challenges, substantial preparations are needed: (1) developing privacy-preserving, secure, and acceptably priced methods for verifying the compliance of hardware, given inspection access; and (2) building an initial, incomplete verification system, with authorities and precedents that allow its gaps to be quickly closed if and when the political will arises.


翻译:智能体可能产生的安全风险已经引起国际社会对智能体监管协议的呼吁。但是,即使各国能够就智能体监管问题达成协议,验证其实施可能会使这些协议变得不可行。为了帮助阐明在智能体监管协议中验证的困难以及确定可能减轻这种困难的行动,本报告研究了在核武器管制领域中进行验证的案例研究。我们回顾了核武器管制协议的三种类型的实施、记录和政治,然后考虑对智能体案例的影响,特别是依靠数以千计的高度专业化芯片进行开发的智能体。在这种情况下,案例研究表明,通过一定的准备工作,可以将预见到的验证挑战降至能够在核武器管制中成功处理的水平。为避免更严重的挑战,需要进行大量的准备工作:(1)开发保护隐私、安全和价格合理的验证硬件的方法,假设检查机制已经实施;(2)建立一个初步的、不完整的验证系统,设立主管部门和先例,以便在政治意愿出现时尽快弥补其缺陷。

0
下载
关闭预览

相关内容

智能体,顾名思义,就是具有智能的实体,英文名是Agent。
美国参谋长联席会议《联合规划》Joint Publication 5-0
专知会员服务
78+阅读 · 2022年5月19日
零样本文本分类,Zero-Shot Learning for Text Classification
专知会员服务
96+阅读 · 2020年5月31日
机器学习入门的经验与建议
专知会员服务
94+阅读 · 2019年10月10日
重磅开讲:图灵奖得主—— Joseph Sifakis
THU数据派
0+阅读 · 2022年6月13日
征稿 | International Joint Conference on Knowledge Graphs (IJCKG)
开放知识图谱
2+阅读 · 2022年5月20日
基于 Carsim 2016 和 Simulink的无人车运动控制联合仿真(四)
逆强化学习-学习人先验的动机
CreateAMind
16+阅读 · 2019年1月18日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
【论文】图上的表示学习综述
机器学习研究会
14+阅读 · 2017年9月24日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2010年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
28+阅读 · 2021年9月18日
Arxiv
12+阅读 · 2019年3月14日
VIP会员
相关VIP内容
美国参谋长联席会议《联合规划》Joint Publication 5-0
专知会员服务
78+阅读 · 2022年5月19日
零样本文本分类,Zero-Shot Learning for Text Classification
专知会员服务
96+阅读 · 2020年5月31日
机器学习入门的经验与建议
专知会员服务
94+阅读 · 2019年10月10日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2010年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员