通用人工智能的快速发展引发了人们对 “红队”的极大兴趣。“红队”是一种对抗性测试实践,起源于军事和网络安全应用。人工智能 “红队 ”引发了许多有关人为因素的问题,例如如何选择 “红队 ”成员、测试过程中的偏见和盲点,以及有害内容对 “红队 ”成员的心理影响。越来越多的人机交互和 CSCW 文献对相关实践进行了研究,包括数据标记、内容节制和算法审核。然而,对 “红队 ”本身进行研究的文献却寥寥无几。本次研讨会旨在探讨与这种做法相关的概念和实证挑战,这种做法往往因保密协议而变得不透明。未来的研究可能会探讨从公平性到心理健康和其他潜在危害领域的各种主题。目标是促进研究人员和从业人员组成一个社区,开始以创造、创新和深思熟虑的方式应对这些挑战。

本研讨会旨在概述人工智能红队的实践,借鉴历史经验,了解其发展轨迹和结构。将优先了解参与人工智能红队的人类,以及他们的角色如何影响人工智能系统的开发。此外,我们还试图利用过去的研究来解决安全问题,并确定与分析红队实践相关的学术学科和方法。我们将重点关注以下主题:

(1) 红队的概念化:受罗伯特-索登及其同事[24]将 CSCW 立足于历史的论点启发,我们旨在了解红队作为一种社会技术合作实践的发展轨迹。这一主题邀请与会者深入讨论红队协作的复杂性,并思考在这一领域开展研究的影响[18]。什么是 “红队”?“红队”的概念是如何随着时间的推移而演变的?红队在更广泛的负责任人工智能框架中扮演什么角色,分散或外部方法如何促进其有效性?

(2) 红队的劳动:这一主题探讨了人工智能红队的人文方面,调查了参与实践的利益相关者及其对塑造人工智能系统的影响,为未来的实践和政策提供信息。通过研究红队实践中涉及的劳动安排和权力动态(例如,技术劳动组织实践中的不平等[23]),我们试图发现历史上的相似之处和当代的方法论,以阐明红队人员的角色和运作框架。历史先例能为我们提供哪些关于红队作为一种劳动实践的启示?我们如何运用多种方法来研究红队人员的劳动结构,包括招募程序和制度承诺?

(3) 红队队员的福祉和伤害:在劳动主题的基础上,本主题重点关注红队队员的安全和福祉。我们将确定战略和干预措施,以减轻红队活动期间接触有害内容可能造成的伤害。通过解决这些关键问题并结合优先考虑工人福利的建议(如 [19]),我们旨在人工智能红队社区内培养一种福利文化。组织如何建立保障措施并设计干预措施,以保护红队人员免受潜在伤害?如何实施这些战略,以确保红队人员在工作中的安全和福祉?

成为VIP会员查看完整内容
18

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
《数字孪生的未来:对国家安全的挑战和影响》
专知会员服务
29+阅读 · 7月11日
《军事域可解释人工智能》
专知会员服务
40+阅读 · 7月4日
《基于专家衍生决策策略的增强自主智能体》
专知会员服务
35+阅读 · 6月5日
《综述:生成式人工智能对虚假新闻的影响》
专知会员服务
32+阅读 · 4月13日
《综述:测试与评估中应用的人工智能工具》
专知会员服务
62+阅读 · 1月22日
《媒体分析军事应用中的协作需求图谱》
专知会员服务
40+阅读 · 2023年5月5日
《人工智能在军事武器系统中的崛起》
专知会员服务
142+阅读 · 2023年3月21日
【MIT博士论文】数据高效强化学习,176页pdf
国家自然科学基金
5+阅读 · 2017年12月31日
国家自然科学基金
33+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
25+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
A Survey of Large Language Models
Arxiv
398+阅读 · 2023年3月31日
Arxiv
20+阅读 · 2023年3月17日
Arxiv
18+阅读 · 2021年3月16日
Arxiv
10+阅读 · 2020年11月26日
VIP会员
相关VIP内容
《数字孪生的未来:对国家安全的挑战和影响》
专知会员服务
29+阅读 · 7月11日
《军事域可解释人工智能》
专知会员服务
40+阅读 · 7月4日
《基于专家衍生决策策略的增强自主智能体》
专知会员服务
35+阅读 · 6月5日
《综述:生成式人工智能对虚假新闻的影响》
专知会员服务
32+阅读 · 4月13日
《综述:测试与评估中应用的人工智能工具》
专知会员服务
62+阅读 · 1月22日
《媒体分析军事应用中的协作需求图谱》
专知会员服务
40+阅读 · 2023年5月5日
《人工智能在军事武器系统中的崛起》
专知会员服务
142+阅读 · 2023年3月21日
相关基金
国家自然科学基金
5+阅读 · 2017年12月31日
国家自然科学基金
33+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
25+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员