许多人工智能应用需人类与AI顾问协同决策,但其成效取决于人类对AI代理的依赖是否适度。我们通过"四连棋"策略游戏平台,采用不同技能水平的神经网络代理,验证了一种评估方法。实验中,我们操控AI建议的存在性、呈现顺序、技能水平及信息展示方式(对手AI的技能水平有时变化),以测量其对用户表现的影响。

结果显示,获得AI建议的人类代理团队表现优于无辅助受试者,其中实时接收AI建议者取得最佳成绩。尽管团队表现更优且受试者在游戏过程中有所提升,但鲜有证据表明他们从AI顾问处习得策略。AI可靠性被证实为团队表现的核心决定因素——即使环境多变,受试者仍对高技能顾问保持信任。数学素养较高者展现最强AI建议运用能力,包括解析含选项排名与概率的详细输出格式。

高可靠性AI代理与高信任度正相关,而过度自信则导致更多拒绝建议、更高成功预期但实际表现略降。此类人机团队的效能取决于三大要素:AI可靠性、用户从建议中提炼洞见的能力,以及用户对建议的信任度。部署人机团队的组织需开展测试,评估用户对AI建议的合理依赖程度。

成为VIP会员查看完整内容
2

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
《基于图计算的多机器人协调与协作​​》139页
专知会员服务
21+阅读 · 4月19日
《用于自主网络行动的竞争性强化学习》113页
专知会员服务
24+阅读 · 1月12日
《在军事仿真环境中优化人工智能算法》最新73页
专知会员服务
31+阅读 · 2024年11月12日
《生成式人工智能和情报评估》
专知会员服务
82+阅读 · 2024年7月22日
《基于特质的多机器人协调建模》191页
专知会员服务
37+阅读 · 2024年6月10日
《基于信念的决策建模计算框架》141页
专知会员服务
59+阅读 · 2024年4月27日
《基于智能体的情境识别系统》148页
专知会员服务
47+阅读 · 2024年4月12日
基于模型的强化学习综述
专知
36+阅读 · 2022年7月13日
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
Arxiv
166+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
452+阅读 · 2023年3月31日
Arxiv
76+阅读 · 2023年3月26日
Arxiv
166+阅读 · 2023年3月24日
Arxiv
24+阅读 · 2023年3月17日
VIP会员
相关VIP内容
《基于图计算的多机器人协调与协作​​》139页
专知会员服务
21+阅读 · 4月19日
《用于自主网络行动的竞争性强化学习》113页
专知会员服务
24+阅读 · 1月12日
《在军事仿真环境中优化人工智能算法》最新73页
专知会员服务
31+阅读 · 2024年11月12日
《生成式人工智能和情报评估》
专知会员服务
82+阅读 · 2024年7月22日
《基于特质的多机器人协调建模》191页
专知会员服务
37+阅读 · 2024年6月10日
《基于信念的决策建模计算框架》141页
专知会员服务
59+阅读 · 2024年4月27日
《基于智能体的情境识别系统》148页
专知会员服务
47+阅读 · 2024年4月12日
相关基金
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
微信扫码咨询专知VIP会员