摘要——联邦学习(FL)在军事合作中越来越多地被采用,以开发大型语言模型(LLM),同时保持数据主权。然而,提示注入攻击——对输入提示的恶意操控——带来了新的威胁,可能会破坏操作安全、扰乱决策过程,并削弱盟友之间的信任。本文从一个角度出发,重点讨论了联邦军事LLM中的四种潜在漏洞:机密数据泄露、搭便车攻击、系统干扰和虚假信息传播。为了应对这些潜在风险,我们提出了一个人类与AI协作的框架,该框架结合了技术和策略上的对策。在技术方面,我们的框架通过红蓝队对抗演习和质量保证手段,检测并缓解共享LLM权重中的对抗性行为。在策略方面,该框架促进了AI与人类政策共同制定及安全协议的验证。我们的研究成果将为未来的研究提供指导,并强调在新兴军事环境中采取积极应对策略的重要性。 关键词:联邦学习、大型语言模型、对抗性攻击、军事政策

成为VIP会员查看完整内容
2

相关内容

强化学习增强的大型语言模型:综述
专知会员服务
42+阅读 · 2024年12月17日
图神经网络在金融欺诈检测中的应用综述
专知会员服务
25+阅读 · 2024年11月22日
迈向可信的人工智能:伦理和稳健的大型语言模型综述
专知会员服务
35+阅读 · 2024年7月28日
大型语言模型的景观:范式与微调策略的全面综述和分析
变革军事行动:探讨人机协同作战(MUM-T)及其前景
专知会员服务
50+阅读 · 2024年4月12日
专知会员服务
98+阅读 · 2020年12月8日
【综述】多智能体强化学习算法理论研究
深度强化学习实验室
12+阅读 · 2020年9月9日
深度学习可解释性研究进展
专知
19+阅读 · 2020年6月26日
模型攻击:鲁棒性联邦学习研究的最新进展
机器之心
34+阅读 · 2020年6月3日
【综述】生成式对抗网络GAN最新进展综述
专知
57+阅读 · 2019年6月5日
理解人类推理的深度学习
论智
18+阅读 · 2018年11月7日
深度学习中的注意力机制
人工智能头条
16+阅读 · 2017年11月2日
国家自然科学基金
27+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
39+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
15+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
Arxiv
164+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
425+阅读 · 2023年3月31日
Arxiv
71+阅读 · 2023年3月26日
Arxiv
155+阅读 · 2023年3月24日
Arxiv
22+阅读 · 2023年3月17日
VIP会员
相关VIP内容
强化学习增强的大型语言模型:综述
专知会员服务
42+阅读 · 2024年12月17日
图神经网络在金融欺诈检测中的应用综述
专知会员服务
25+阅读 · 2024年11月22日
迈向可信的人工智能:伦理和稳健的大型语言模型综述
专知会员服务
35+阅读 · 2024年7月28日
大型语言模型的景观:范式与微调策略的全面综述和分析
变革军事行动:探讨人机协同作战(MUM-T)及其前景
专知会员服务
50+阅读 · 2024年4月12日
专知会员服务
98+阅读 · 2020年12月8日
相关资讯
【综述】多智能体强化学习算法理论研究
深度强化学习实验室
12+阅读 · 2020年9月9日
深度学习可解释性研究进展
专知
19+阅读 · 2020年6月26日
模型攻击:鲁棒性联邦学习研究的最新进展
机器之心
34+阅读 · 2020年6月3日
【综述】生成式对抗网络GAN最新进展综述
专知
57+阅读 · 2019年6月5日
理解人类推理的深度学习
论智
18+阅读 · 2018年11月7日
深度学习中的注意力机制
人工智能头条
16+阅读 · 2017年11月2日
相关基金
国家自然科学基金
27+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
39+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
15+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
微信扫码咨询专知VIP会员