本会议总结报告强调了国防中人机协作测试与评估(T&E)的必要性,并提供了对相关挑战的理解,特别是测量和测试协议。会议将帮助与会者在各自领域开展富有成效的工作,尤其是在技术、操作和政策领域架起沟通的桥梁。
军事领域的负责任人工智能(REAIM)行动呼吁(2023年)主张在军事领域采用人工智能之前进行全面研究、测试和保证,以避免意外伤害。本次会议旨在为 REAIM 社区提供有关人机团队测试与评估 (T&E) 的背景信息。传统上,关于人工智能算法测试的讨论非常广泛,但关于人机团队的讨论较少。与此类测试和评估相关的实际和技术挑战有很多--本次会议将以更广泛的社区(技术和非技术社区)可理解的方式阐述这些问题、相关问题和影响。加深对技术与评估的理解将有助于推动负责任的人工智能政策制定,以及这些系统的获取和部署。本次会议将有助于更好地处理这些问题,并激励全社会投资于解决这些挑战。
1.如何才能将人的因素纳入可靠的 T&E 流程,并培养一支熟练的队伍来支持这种整合?
2.评估 HMT 需要哪些测试和衡量标准,它们与人工智能算法的测试和衡量标准有何不同?
3.鉴于当前 T&E 能力的局限性,如何才能最好地为 HMT 实施负责任的人工智能?