《交互式对抗智能体开发中的行为克隆方法比较》论文 - 专知VIP

会员服务 ·

28

AI与军事 · 智能体 · 军事游戏 · 建模与仿真 ·

2023 年 8 月 20 日

《交互式对抗智能体开发中的行为克隆方法比较》论文

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

现代建模和仿真环境（如商业游戏或军事训练系统）经常要求交互式智能体按照预先确定的规范（如故事板或军事战术文件）表现出逼真和反应灵敏的行为。创建智能体的传统方法（如状态机或行为树）需要花费大量精力，通过人工知识工程来开发状态表示和转换过程。另一方面，较新的行为生成技术（如深度强化学习）需要大量的训练数据（在许多情况下需要几个世纪），而且无法保证生成的行为与预期目标和行动方案一致。本文研究了行为克隆方法在设计交互式智能体中的应用。在我们的方法中，用户首先通过状态机模型或行为树等直接方法定义所需的行为。然后，使用行为克隆方法将从这些模型中采样的真实轨迹数据转化为可微分策略，并通过参与互动游戏环境进一步完善这些策略。通过对任务性能和训练稳定性进行比较，这种方法可以改善训练结果。

成为VIP会员查看完整内容

55

相关内容

AI与军事

人工智能在军事中可用于多项任务，例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。

黑盒模型如何透明化？MIT博士论文《黑盒模型的可解释性和透明性技术》，207页pdf阐述可信赖机器学习路径

黑盒模型如何透明化？MIT博士论文《黑盒模型的可解释性和透明性技术》，207页pdf阐述可信赖机器学习路径

专知会员服务

63+阅读 · 2023年4月29日

《深度强化学习在集群系统中的应用》31页论文

《深度强化学习在集群系统中的应用》31页论文

专知会员服务

59+阅读 · 2023年3月14日

《人机交互中机器学习的透明通信》论文

《人机交互中机器学习的透明通信》论文

专知会员服务

33+阅读 · 2023年3月12日

《基于知识图谱的有限交互决策过程框架》17页论文

《基于知识图谱的有限交互决策过程框架》17页论文

专知会员服务

66+阅读 · 2023年3月5日

《基于人工智能的态势感知评估》论文

《基于人工智能的态势感知评估》论文

专知会员服务

125+阅读 · 2023年2月21日

《动态知识图谱的更新嵌入》55页论文

《动态知识图谱的更新嵌入》55页论文

专知会员服务

34+阅读 · 2022年6月22日

浙大《深度学习低样本目标检测》综述论文

浙大《深度学习低样本目标检测》综述论文

专知会员服务

76+阅读 · 2021年12月13日

《过参数化机器学习理论》综述论文

《过参数化机器学习理论》综述论文

专知会员服务

46+阅读 · 2021年9月19日

深度神经网络不确定性研究综述论文

专知会员服务

92+阅读 · 2021年7月9日

最新《深度多模态数据分析》综述论文，26页pdf

最新《深度多模态数据分析》综述论文，26页pdf

专知会员服务

302+阅读 · 2020年6月16日

《多智能体系统中的目标管理》莱特州立大学博士论文

《多智能体系统中的目标管理》莱特州立大学博士论文

专知

8+阅读 · 2022年11月27日

机器学习可解释如何客观评估？CMU-Yeh博士论文《可解释机器学习的客观标准》，148页pdf

机器学习可解释如何客观评估？CMU-Yeh博士论文《可解释机器学习的客观标准》，148页pdf

专知

5+阅读 · 2022年11月23日

【ECCV2022教程】基于自动驾驶数据的自监督学习研究进展，220页ppt

【ECCV2022教程】基于自动驾驶数据的自监督学习研究进展，220页ppt

专知

2+阅读 · 2022年10月26日

《基于博弈论的高级持续威胁（APT）防御方法》25页最新论文

《基于博弈论的高级持续威胁（APT）防御方法》25页最新论文

专知

9+阅读 · 2022年10月9日

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

专知

8+阅读 · 2022年9月21日

经典算法与神经网络如何结合？德国康斯坦茨大学Felix Petersen《可微算法学习》博士论文，162页pdf

经典算法与神经网络如何结合？德国康斯坦茨大学Felix Petersen《可微算法学习》博士论文，162页pdf

专知

1+阅读 · 2022年9月12日

190页pdf伯克利博士论文《自适应持续的具身智能体》，系统全面阐述机器人技术

190页pdf伯克利博士论文《自适应持续的具身智能体》，系统全面阐述机器人技术

专知

3+阅读 · 2022年8月29日

【哈佛大学-Cell】通过多模态深度学习的泛癌症综合组织基因组分析

【哈佛大学-Cell】通过多模态深度学习的泛癌症综合组织基因组分析

专知

1+阅读 · 2022年8月12日

最新《知识驱动的文本生成》综述论文，44页pdf

最新《知识驱动的文本生成》综述论文，44页pdf

专知

25+阅读 · 2020年10月14日

最新《图嵌入组合优化》综述论文，40页pdf

最新《图嵌入组合优化》综述论文，40页pdf

专知

41+阅读 · 2020年8月31日

基于学习的智能化漏洞挖掘关键技术研究

国家自然科学基金

6+阅读 · 2017年12月31日

基于进化算法的大规模本体匹配问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向服务的复杂产品设计建模与协同决策方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

心脏的多形态耦合与层级级联计算可视化方法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

29+阅读 · 2015年12月31日

基于低维连续表示的启发式智能规划技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

面向类脑计算存储器的调制编码理论及方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

PMSSC: Parallelizable multi-subset based self-expressive model for subspace clustering

Arxiv

0+阅读 · 2023年10月5日

Simultaneous inference for monotone and smoothly time varying functions under complex temporal dynamics

Arxiv

0+阅读 · 2023年10月3日

Bayesian spline-based hidden Markov models with applications to actimetry data and sleep analysis

Arxiv

0+阅读 · 2023年10月2日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

174+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

106+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

224+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

A survey and taxonomy of loss functions in machine learning

Arxiv

27+阅读 · 2023年1月13日

Meta-learning in natural and artificial intelligence

Arxiv

10+阅读 · 2020年11月26日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

19+阅读 · 2019年1月14日

VIP会员

相关主题

建模与仿真

相关VIP内容

黑盒模型如何透明化？MIT博士论文《黑盒模型的可解释性和透明性技术》，207页pdf阐述可信赖机器学习路径

黑盒模型如何透明化？MIT博士论文《黑盒模型的可解释性和透明性技术》，207页pdf阐述可信赖机器学习路径

专知会员服务

63+阅读 · 2023年4月29日

《深度强化学习在集群系统中的应用》31页论文

《深度强化学习在集群系统中的应用》31页论文

专知会员服务

59+阅读 · 2023年3月14日

《人机交互中机器学习的透明通信》论文

《人机交互中机器学习的透明通信》论文

专知会员服务

33+阅读 · 2023年3月12日

《基于知识图谱的有限交互决策过程框架》17页论文

《基于知识图谱的有限交互决策过程框架》17页论文

专知会员服务

66+阅读 · 2023年3月5日

《基于人工智能的态势感知评估》论文

《基于人工智能的态势感知评估》论文

专知会员服务

125+阅读 · 2023年2月21日

《动态知识图谱的更新嵌入》55页论文

《动态知识图谱的更新嵌入》55页论文

专知会员服务

34+阅读 · 2022年6月22日

浙大《深度学习低样本目标检测》综述论文

浙大《深度学习低样本目标检测》综述论文

专知会员服务

76+阅读 · 2021年12月13日

《过参数化机器学习理论》综述论文

《过参数化机器学习理论》综述论文

专知会员服务

46+阅读 · 2021年9月19日

深度神经网络不确定性研究综述论文

专知会员服务

92+阅读 · 2021年7月9日

最新《深度多模态数据分析》综述论文，26页pdf

最新《深度多模态数据分析》综述论文，26页pdf

专知会员服务

302+阅读 · 2020年6月16日

热门VIP内容

开通专知VIP会员享更多权益服务

大语言模型智能体强化学习：全景综述

《城市滨海地区：理解复杂多变环境下的指挥控制框架》50页报告

【伯克利博士论文】从推理服务到训练：面向大规模 LLM 智能体的高效系统

美空军“顶点2025”实验：推进AI在C2、动态目标锁定与联盟集成中的应用

相关资讯

《多智能体系统中的目标管理》莱特州立大学博士论文

《多智能体系统中的目标管理》莱特州立大学博士论文

专知

8+阅读 · 2022年11月27日

机器学习可解释如何客观评估？CMU-Yeh博士论文《可解释机器学习的客观标准》，148页pdf

机器学习可解释如何客观评估？CMU-Yeh博士论文《可解释机器学习的客观标准》，148页pdf

专知

5+阅读 · 2022年11月23日

【ECCV2022教程】基于自动驾驶数据的自监督学习研究进展，220页ppt

【ECCV2022教程】基于自动驾驶数据的自监督学习研究进展，220页ppt

专知

2+阅读 · 2022年10月26日

《基于博弈论的高级持续威胁（APT）防御方法》25页最新论文

《基于博弈论的高级持续威胁（APT）防御方法》25页最新论文

专知

9+阅读 · 2022年10月9日

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

专知

8+阅读 · 2022年9月21日

经典算法与神经网络如何结合？德国康斯坦茨大学Felix Petersen《可微算法学习》博士论文，162页pdf

经典算法与神经网络如何结合？德国康斯坦茨大学Felix Petersen《可微算法学习》博士论文，162页pdf

专知

1+阅读 · 2022年9月12日

190页pdf伯克利博士论文《自适应持续的具身智能体》，系统全面阐述机器人技术

190页pdf伯克利博士论文《自适应持续的具身智能体》，系统全面阐述机器人技术

专知

3+阅读 · 2022年8月29日

【哈佛大学-Cell】通过多模态深度学习的泛癌症综合组织基因组分析

【哈佛大学-Cell】通过多模态深度学习的泛癌症综合组织基因组分析

专知

1+阅读 · 2022年8月12日

最新《知识驱动的文本生成》综述论文，44页pdf

最新《知识驱动的文本生成》综述论文，44页pdf

专知

25+阅读 · 2020年10月14日

最新《图嵌入组合优化》综述论文，40页pdf

最新《图嵌入组合优化》综述论文，40页pdf

专知

41+阅读 · 2020年8月31日

相关基金

基于学习的智能化漏洞挖掘关键技术研究

国家自然科学基金

6+阅读 · 2017年12月31日

基于进化算法的大规模本体匹配问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向服务的复杂产品设计建模与协同决策方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

心脏的多形态耦合与层级级联计算可视化方法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

29+阅读 · 2015年12月31日

基于低维连续表示的启发式智能规划技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

面向类脑计算存储器的调制编码理论及方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

相关论文

PMSSC: Parallelizable multi-subset based self-expressive model for subspace clustering

Arxiv

0+阅读 · 2023年10月5日

Simultaneous inference for monotone and smoothly time varying functions under complex temporal dynamics

Arxiv

0+阅读 · 2023年10月3日

Bayesian spline-based hidden Markov models with applications to actimetry data and sleep analysis

Arxiv

0+阅读 · 2023年10月2日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

174+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

106+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

224+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

A survey and taxonomy of loss functions in machine learning

Arxiv

27+阅读 · 2023年1月13日

Meta-learning in natural and artificial intelligence

Arxiv

10+阅读 · 2020年11月26日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

19+阅读 · 2019年1月14日

微信扫码咨询专知VIP会员