《模拟人类-自主协作的避撞决策模型》美陆军2023最新技术报告 - 专知VIP

会员服务 ·

16

逆向强化学习 · AI与军事 · 人机协作 · 美国陆军研究实验室（ARL） ·

2023 年 5 月 18 日

《模拟人类-自主协作的避撞决策模型》美陆军2023最新技术报告

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

创造能够适应人类同行的人工智能队友的一个必要步骤是开发能够向人工智能系统表达人类目标和意图的计算建模方法。用各种各样的方法来实现这个目标是可能的，从提供过去数据的纯粹预测的模型到仅基于理论的生成模型。一种有希望的方法是所谓的从示范中学习的方法（Argall等人，2009；Ravichandar等人，2020），这种研究主旨是利用示范数据，如专家执行任务的行为，并训练模型（通常被称为 "智能体"）来执行专家的任务。在本报告中，我们采用了从示范中学习的方法来模拟和预测模拟机器人在避免碰撞的团队任务中的行为。具体来说，我们采用了逆向强化学习（IRL）（Ng和Russell，2000年；Arora和Doshi，2021年），这是一种从演示中推断奖励函数的方法。

这项任务是基于一个研究性的视频游戏，被用来研究人类-自主性的团队合作（Adamson等人，2017年），涉及一个由人类玩家和一个人工智能agent共同控制的机器人。在没有玩家输入的情况下，人工智能agent控制机器人，但玩家可以在任何时候推翻agent，类似于现实世界中与自动驾驶助手一起驾驶的情况。这项任务对旨在模拟人类意图的示范学习方法提出了挑战，因为观察到的任务行为来自两个示范者的控制：一个是人类，一个是自动驾驶。例如，人类的行为可能是由对自己的目标的理解和对人工智能的目标的估计产生的。此外，当人工智能处于控制状态时，所有关于人类的信息都是他们不提供输入的，人类对人工智能的选择的同意程度是隐藏的。

我们对这一特定任务的关注是由我们的团队正在进行的工作所激发的，即利用激发这一任务的研究视频游戏从参与者那里收集数据。最终，我们将尝试模拟真实的人在长时间内的行为--每天玩180天--以促进适应性AI代理的发展。这里描述的工作是对一种方法的验证，这种方法将推动我们的团队实现这一目标；然而，这种方法具有足够的通用性，其核心概念可以应用于其他地方。

成为VIP会员查看完整内容

34

相关内容

逆向强化学习

逆向强化学习

《人机协作的避撞决策模型》美国陆军2023最新报告

《人机协作的避撞决策模型》美国陆军2023最新报告

专知会员服务

66+阅读 · 2023年4月17日

人机协作 |《人类-自主性协同编队信任工具包（HAT3）》美陆军28页报告

人机协作 |《人类-自主性协同编队信任工具包（HAT3）》美陆军28页报告

专知会员服务

73+阅读 · 2023年4月16日

《针对算法战的人工智能操作化》美陆军报告（译文）

《针对算法战的人工智能操作化》美陆军报告（译文）

专知会员服务

142+阅读 · 2023年1月14日

《人工智能在陆军中的应用》31页报告，德国陆军概念和能力发展中心

《人工智能在陆军中的应用》31页报告，德国陆军概念和能力发展中心

专知会员服务

137+阅读 · 2023年1月13日

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

专知会员服务

100+阅读 · 2022年11月24日

《士兵状态估计：建模与分析（技术报告摘要》美陆军2022最新12页报告

《士兵状态估计：建模与分析（技术报告摘要》美陆军2022最新12页报告

专知会员服务

62+阅读 · 2022年10月27日

《综述：人类与智能体间的通信问题》美国陆军29页技术报告

《综述：人类与智能体间的通信问题》美国陆军29页技术报告

专知会员服务

96+阅读 · 2022年9月27日

【中文版】《为战术空对空作战训练建立CGF模型 - 基于动机的行为和机器学习的通用架构》北约技术报告

【中文版】《为战术空对空作战训练建立CGF模型 - 基于动机的行为和机器学习的通用架构》北约技术报告

专知会员服务

68+阅读 · 2022年8月25日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知会员服务

156+阅读 · 2022年8月24日

推荐！中文版《作战战略机动的多智能体协作强化学习研究综述》美国陆军研究实验室最新33页研究报告

推荐！中文版《作战战略机动的多智能体协作强化学习研究综述》美国陆军研究实验室最新33页研究报告

专知会员服务

308+阅读 · 2022年6月23日

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

专知

12+阅读 · 2022年11月25日

《半机械士兵2050：人机融合及其对美国防部未来的影响》美国陆军研究实验室42页技术报告

《半机械士兵2050：人机融合及其对美国防部未来的影响》美国陆军研究实验室42页技术报告

专知

25+阅读 · 2022年11月20日

《军事行动自动化》【译文】2022最新报告

《军事行动自动化》【译文】2022最新报告

专知

65+阅读 · 2022年11月13日

戴着VR头盔教机器人抓握，机器人当场就学会了

戴着VR头盔教机器人抓握，机器人当场就学会了

机器之心

0+阅读 · 2022年10月21日

《人工智能指导作战管理：在多域作战中实现融合》【中文版】美国陆军47页技术报告

《人工智能指导作战管理：在多域作战中实现融合》【中文版】美国陆军47页技术报告

专知

159+阅读 · 2022年10月12日

推荐！《综述：人工智能的心智理论和元推理》美国陆军研究实验室2022最新21页报告

推荐！《综述：人工智能的心智理论和元推理》美国陆军研究实验室2022最新21页报告

专知

5+阅读 · 2022年9月27日

推荐！【美国陆军战略项目年度报告】《人工智能（AI）用于多域作战（MDO）的指挥和控制（C2）》完整译文，美国陆军研究实验室

推荐！【美国陆军战略项目年度报告】《人工智能（AI）用于多域作战（MDO）的指挥和控制（C2）》完整译文，美国陆军研究实验室

专知

57+阅读 · 2022年9月24日

《打人工智能之战：关于未来人工智能战争的作战概念》澳大利亚国防部116页报告

《打人工智能之战：关于未来人工智能战争的作战概念》澳大利亚国防部116页报告

专知

165+阅读 · 2022年9月19日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知

57+阅读 · 2022年8月25日

【军事博弈论】在大规模战斗行动中为旅级作战部队制定有效的优先情报需求

【军事博弈论】在大规模战斗行动中为旅级作战部队制定有效的优先情报需求

专知

57+阅读 · 2022年6月9日

运动技能认知模型与认知机器人"感知－行动"环的形成研究

国家自然科学基金

4+阅读 · 2012年12月31日

面向人与Agent混合的多团队协作仿真训练方法研究

国家自然科学基金

19+阅读 · 2012年12月31日

指向性宽带四边形弯张换能器理论研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向人机团队的智能规划方法及实验研究

国家自然科学基金

1+阅读 · 2012年12月31日

虚拟现实中的人类路径整合研究

国家自然科学基金

7+阅读 · 2012年12月31日

基于行为决策理论的隐性目标决策模型与方法研究

国家自然科学基金

5+阅读 · 2012年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

21+阅读 · 2009年12月31日

虚拟森林环境中森林-环境要素之间交互行为的建模与仿真

国家自然科学基金

0+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

基于轨迹灵敏度的模型预测紧急电压控制研究

国家自然科学基金

0+阅读 · 2009年12月31日

Zespol: A Lightweight Environment for Training Swarming Agents

Arxiv

0+阅读 · 2023年6月30日

RdSOBA: Rendered Shadow-Object Association Dataset

Arxiv

0+阅读 · 2023年6月30日

Artificial Intelligence for the Metaverse: A Survey

Arxiv

31+阅读 · 2022年2月15日

Attention Mechanisms in Computer Vision: A Survey

Arxiv

58+阅读 · 2021年11月15日

Multi-Agent Simulation for AI Behaviour Discovery in Operations Research

Arxiv

39+阅读 · 2021年8月30日

Building Intelligent Autonomous Navigation Agents

Arxiv

24+阅读 · 2021年6月25日

A continual learning survey: Defying forgetting in classification tasks

Arxiv

32+阅读 · 2021年4月16日

KG-BART: Knowledge Graph-Augmented BART for Generative Commonsense Reasoning

Arxiv

27+阅读 · 2021年1月21日

Commonsense Reasoning for Natural Language Understanding: A Survey of Benchmarks, Resources, and Approaches

Arxiv

16+阅读 · 2019年4月2日

Self-Driving Cars: A Survey

Self-Driving Cars: A Survey

Arxiv

41+阅读 · 2019年1月14日

VIP会员

相关主题

逆向强化学习

美国陆军研究实验室（ARL）

相关VIP内容

《人机协作的避撞决策模型》美国陆军2023最新报告

《人机协作的避撞决策模型》美国陆军2023最新报告

专知会员服务

66+阅读 · 2023年4月17日

人机协作 |《人类-自主性协同编队信任工具包（HAT3）》美陆军28页报告

人机协作 |《人类-自主性协同编队信任工具包（HAT3）》美陆军28页报告

专知会员服务

73+阅读 · 2023年4月16日

《针对算法战的人工智能操作化》美陆军报告（译文）

《针对算法战的人工智能操作化》美陆军报告（译文）

专知会员服务

142+阅读 · 2023年1月14日

《人工智能在陆军中的应用》31页报告，德国陆军概念和能力发展中心

《人工智能在陆军中的应用》31页报告，德国陆军概念和能力发展中心

专知会员服务

137+阅读 · 2023年1月13日

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

专知会员服务

100+阅读 · 2022年11月24日

《士兵状态估计：建模与分析（技术报告摘要》美陆军2022最新12页报告

《士兵状态估计：建模与分析（技术报告摘要》美陆军2022最新12页报告

专知会员服务

62+阅读 · 2022年10月27日

《综述：人类与智能体间的通信问题》美国陆军29页技术报告

《综述：人类与智能体间的通信问题》美国陆军29页技术报告

专知会员服务

96+阅读 · 2022年9月27日

【中文版】《为战术空对空作战训练建立CGF模型 - 基于动机的行为和机器学习的通用架构》北约技术报告

【中文版】《为战术空对空作战训练建立CGF模型 - 基于动机的行为和机器学习的通用架构》北约技术报告

专知会员服务

68+阅读 · 2022年8月25日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知会员服务

156+阅读 · 2022年8月24日

推荐！中文版《作战战略机动的多智能体协作强化学习研究综述》美国陆军研究实验室最新33页研究报告

推荐！中文版《作战战略机动的多智能体协作强化学习研究综述》美国陆军研究实验室最新33页研究报告

专知会员服务

308+阅读 · 2022年6月23日

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关资讯

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

专知

12+阅读 · 2022年11月25日

《半机械士兵2050：人机融合及其对美国防部未来的影响》美国陆军研究实验室42页技术报告

《半机械士兵2050：人机融合及其对美国防部未来的影响》美国陆军研究实验室42页技术报告

专知

25+阅读 · 2022年11月20日

《军事行动自动化》【译文】2022最新报告

《军事行动自动化》【译文】2022最新报告

专知

65+阅读 · 2022年11月13日

戴着VR头盔教机器人抓握，机器人当场就学会了

戴着VR头盔教机器人抓握，机器人当场就学会了

机器之心

0+阅读 · 2022年10月21日

《人工智能指导作战管理：在多域作战中实现融合》【中文版】美国陆军47页技术报告

《人工智能指导作战管理：在多域作战中实现融合》【中文版】美国陆军47页技术报告

专知

159+阅读 · 2022年10月12日

推荐！《综述：人工智能的心智理论和元推理》美国陆军研究实验室2022最新21页报告

推荐！《综述：人工智能的心智理论和元推理》美国陆军研究实验室2022最新21页报告

专知

5+阅读 · 2022年9月27日

推荐！【美国陆军战略项目年度报告】《人工智能（AI）用于多域作战（MDO）的指挥和控制（C2）》完整译文，美国陆军研究实验室

推荐！【美国陆军战略项目年度报告】《人工智能（AI）用于多域作战（MDO）的指挥和控制（C2）》完整译文，美国陆军研究实验室

专知

57+阅读 · 2022年9月24日

《打人工智能之战：关于未来人工智能战争的作战概念》澳大利亚国防部116页报告

《打人工智能之战：关于未来人工智能战争的作战概念》澳大利亚国防部116页报告

专知

165+阅读 · 2022年9月19日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知

57+阅读 · 2022年8月25日

【军事博弈论】在大规模战斗行动中为旅级作战部队制定有效的优先情报需求

【军事博弈论】在大规模战斗行动中为旅级作战部队制定有效的优先情报需求

专知

57+阅读 · 2022年6月9日

相关基金

运动技能认知模型与认知机器人"感知－行动"环的形成研究

国家自然科学基金

4+阅读 · 2012年12月31日

面向人与Agent混合的多团队协作仿真训练方法研究

国家自然科学基金

19+阅读 · 2012年12月31日

指向性宽带四边形弯张换能器理论研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向人机团队的智能规划方法及实验研究

国家自然科学基金

1+阅读 · 2012年12月31日

虚拟现实中的人类路径整合研究

国家自然科学基金

7+阅读 · 2012年12月31日

基于行为决策理论的隐性目标决策模型与方法研究

国家自然科学基金

5+阅读 · 2012年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

21+阅读 · 2009年12月31日

虚拟森林环境中森林-环境要素之间交互行为的建模与仿真

国家自然科学基金

0+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

基于轨迹灵敏度的模型预测紧急电压控制研究

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Zespol: A Lightweight Environment for Training Swarming Agents

Arxiv

0+阅读 · 2023年6月30日

RdSOBA: Rendered Shadow-Object Association Dataset

Arxiv

0+阅读 · 2023年6月30日

Artificial Intelligence for the Metaverse: A Survey

Arxiv

31+阅读 · 2022年2月15日

Attention Mechanisms in Computer Vision: A Survey

Arxiv

58+阅读 · 2021年11月15日

Multi-Agent Simulation for AI Behaviour Discovery in Operations Research

Arxiv

39+阅读 · 2021年8月30日

Building Intelligent Autonomous Navigation Agents

Arxiv

24+阅读 · 2021年6月25日

A continual learning survey: Defying forgetting in classification tasks

Arxiv

32+阅读 · 2021年4月16日

KG-BART: Knowledge Graph-Augmented BART for Generative Commonsense Reasoning

Arxiv

27+阅读 · 2021年1月21日

Commonsense Reasoning for Natural Language Understanding: A Survey of Benchmarks, Resources, and Approaches

Arxiv

16+阅读 · 2019年4月2日

Self-Driving Cars: A Survey

Self-Driving Cars: A Survey

Arxiv

41+阅读 · 2019年1月14日

微信扫码咨询专知VIP会员