《用于水下目标定位的平台便携式强化学习方法》 - 专知VIP

会员服务 ·

14

AI与军事 · 强化学习 · 水下目标定位 ·

2024 年 1 月 2 日

《用于水下目标定位的平台便携式强化学习方法》

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

强化学习（RL）方法的主要关注点之一是如何将在模拟环境中学到的策略转移到现实环境中，同时获得相似的行为和性能（即模拟到现实的可转移性），这一点在机器人控制器中尤为重要[1]。在过去的几年里，为了缩小模拟世界与现实世界之间的差距，实现更有效的策略转移，人们已经跟踪了多个研究方向。领域随机化是学习迁移中应用最广泛的方法之一，它将模型暴露在各种条件下，使模型对这些方面的建模误差具有鲁棒性。随机化被认为是实现从模拟到真实转移和一般稳健策略的关键[2]。另一种常用的方法是系统识别，它使用具有精确物理和动态系统数学模型的高保真环境。不过，系统识别的缺点是计算量大，因此需要更多时间进行训练。其他相关方法有零点转移法和域适应法 [3]。

大多数关于 RL 的研究都集中在使用端到端方法的低级控制器上，其中 RL 网络将机载传感器提供的原始信息作为输入，并将应用于执行器的连续控制动作作为输出 [4]。然而，这种方法有两个主要局限性：(i) 它对平台的配置有很强的依赖性，例如，与传感器提供的信息及其质量有关，或与推进器等执行器的数量及其配置有关；(ii) 模拟到现实的传输差距更难缩小，因为经过训练的策略会受到机器人平台动态的强烈影响。例如，在文献[5]中，作者在真实飞行器中使用了第二个训练过程，学习过程继续在线进行。在文献[6]中，控制器需要进行额外的调整，以弥补模拟与真实世界之间的差异，但即便如此，现场结果仍显示出较低的性能。

在本研究中，我们介绍了一种平台便携式深度强化学习方法，该方法已被用作自主车辆定位水下物体的路径规划系统，如图 1 所示。我们设计了一个高级控制系统，以减少上述问题，并具有强大的模拟到实际的传输能力。此外，我们的方法易于配置，可在不同平台和不同条件下部署。例如，训练有素的智能体已成功部署在两种不同的飞行器上： (i) 液体机器人公司（Liquid Robotics，美国）的自主水面飞行器（ASV）"波浪滑翔机"；以及 (ii) IQUA 机器人公司（IQUA Robotics，西班牙）的自主水下飞行器（AUV）"Sparus II"。测试在加利福尼亚州蒙特雷湾和西班牙加泰罗尼亚 Sant Feliu de Guıxols 港口进行。在这两种情况下，飞行器都使用了仅测距的目标跟踪方法来定位锚定的应答器[7]。

图 1：制导、导航和控制系统，以及与制导相关的一些主要研究方向。用粗体字表示详细描述的方面。

成为VIP会员查看完整内容

27

相关内容

AI与军事

人工智能在军事中可用于多项任务，例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。

《基础模型在现实世界机器人应用》综述

《基础模型在现实世界机器人应用》综述

专知会员服务

54+阅读 · 2024年2月11日

《基于开源软件强化学习的计算机生成兵力》

《基于开源软件强化学习的计算机生成兵力》

专知会员服务

72+阅读 · 2024年1月21日

《基于元学习的水下系统（鱼雷）数字孪生解决方案》

《基于元学习的水下系统（鱼雷）数字孪生解决方案》

专知会员服务

41+阅读 · 2024年1月12日

《用于空战机动的分层多智能体强化学习》

《用于空战机动的分层多智能体强化学习》

专知会员服务

64+阅读 · 2023年10月5日

《利用音频传感器网络检测、识别和跟踪无人机的时频协同方法》

《利用音频传感器网络检测、识别和跟踪无人机的时频协同方法》

专知会员服务

37+阅读 · 2023年9月11日

《基于超视距空战模拟的有效导弹发射监督机器学习》

《基于超视距空战模拟的有效导弹发射监督机器学习》

专知会员服务

44+阅读 · 2023年7月10日

《基于超视距空战模拟的有效导弹发射监督机器学习》（含代码）

《基于超视距空战模拟的有效导弹发射监督机器学习》（含代码）

专知会员服务

49+阅读 · 2023年6月26日

《利用真实和合成红外海上图像进行自动目标识别的深度学习》英国国防学院

《利用真实和合成红外海上图像进行自动目标识别的深度学习》英国国防学院

专知会员服务

42+阅读 · 2023年6月25日

《学习型系统的保证性》美国空军研究实验室2022最新56页技术报告

《学习型系统的保证性》美国空军研究实验室2022最新56页技术报告

专知会员服务

35+阅读 · 2022年11月22日

《基于强化学习开发战斗行为》美国海军研究生院

《基于强化学习开发战斗行为》美国海军研究生院

专知会员服务

97+阅读 · 2022年6月27日

【斯坦福博士论文】机器人仿真与控制的组合优化，210页pdf

【斯坦福博士论文】机器人仿真与控制的组合优化，210页pdf

专知

9+阅读 · 2023年4月12日

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

专知

29+阅读 · 2023年4月11日

【2023新书】深度学习与计算机视觉在遥感中的应用，572页pdf

【2023新书】深度学习与计算机视觉在遥感中的应用，572页pdf

专知

27+阅读 · 2023年4月6日

「基于通信的多智能体强化学习」进展综述

「基于通信的多智能体强化学习」进展综述

专知

30+阅读 · 2022年11月12日

《使用机器学习智能体设计基于模拟的空战飞行员训练系统》2022瑞典林雪平大学页论文

《使用机器学习智能体设计基于模拟的空战飞行员训练系统》2022瑞典林雪平大学页论文

专知

37+阅读 · 2022年10月30日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知

57+阅读 · 2022年8月25日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

【干货书】《机器学习动力系统与控制》，572页pdf

【干货书】《机器学习动力系统与控制》，572页pdf

专知

35+阅读 · 2022年1月8日

【KDD2020-Tutorial】深度学习异常检测，180页ppt

【KDD2020-Tutorial】深度学习异常检测，180页ppt

专知

49+阅读 · 2020年8月28日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

36+阅读 · 2020年5月2日

基于主动轮廓模型的海洋航空遥感图像的边缘检测模型和最优化策略研究

国家自然科学基金

2+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

基于多轴飞行器航拍数据的植物生长分析与建模

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度表达和迁移学习的人体检测研究

国家自然科学基金

6+阅读 · 2015年12月31日

移动增强现实中基于视觉—惯性传感器的混合跟踪方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

11+阅读 · 2015年12月31日

基于虚拟原型的信息物理融合系统高效可信构造研究

国家自然科学基金

7+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

大数据环境下基于GMDH的客户分类半监督集成模型研究

国家自然科学基金

1+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

476+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

147+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

173+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

VIP会员

相关主题

水下目标定位

相关VIP内容

《基础模型在现实世界机器人应用》综述

《基础模型在现实世界机器人应用》综述

专知会员服务

54+阅读 · 2024年2月11日

《基于开源软件强化学习的计算机生成兵力》

《基于开源软件强化学习的计算机生成兵力》

专知会员服务

72+阅读 · 2024年1月21日

《基于元学习的水下系统（鱼雷）数字孪生解决方案》

《基于元学习的水下系统（鱼雷）数字孪生解决方案》

专知会员服务

41+阅读 · 2024年1月12日

《用于空战机动的分层多智能体强化学习》

《用于空战机动的分层多智能体强化学习》

专知会员服务

64+阅读 · 2023年10月5日

《利用音频传感器网络检测、识别和跟踪无人机的时频协同方法》

《利用音频传感器网络检测、识别和跟踪无人机的时频协同方法》

专知会员服务

37+阅读 · 2023年9月11日

《基于超视距空战模拟的有效导弹发射监督机器学习》

《基于超视距空战模拟的有效导弹发射监督机器学习》

专知会员服务

44+阅读 · 2023年7月10日

《基于超视距空战模拟的有效导弹发射监督机器学习》（含代码）

《基于超视距空战模拟的有效导弹发射监督机器学习》（含代码）

专知会员服务

49+阅读 · 2023年6月26日

《利用真实和合成红外海上图像进行自动目标识别的深度学习》英国国防学院

《利用真实和合成红外海上图像进行自动目标识别的深度学习》英国国防学院

专知会员服务

42+阅读 · 2023年6月25日

《学习型系统的保证性》美国空军研究实验室2022最新56页技术报告

《学习型系统的保证性》美国空军研究实验室2022最新56页技术报告

专知会员服务

35+阅读 · 2022年11月22日

《基于强化学习开发战斗行为》美国海军研究生院

《基于强化学习开发战斗行为》美国海军研究生院

专知会员服务

97+阅读 · 2022年6月27日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】以人为中心的强化学习

任务规划与地形分析：现代复杂环境作战导航体系

认知优势：人工智能在国家安全决策中的核心作用

大模型赋能的具身智能：决策与具身学习综述

相关资讯

【斯坦福博士论文】机器人仿真与控制的组合优化，210页pdf

【斯坦福博士论文】机器人仿真与控制的组合优化，210页pdf

专知

9+阅读 · 2023年4月12日

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

专知

29+阅读 · 2023年4月11日

【2023新书】深度学习与计算机视觉在遥感中的应用，572页pdf

【2023新书】深度学习与计算机视觉在遥感中的应用，572页pdf

专知

27+阅读 · 2023年4月6日

「基于通信的多智能体强化学习」进展综述

「基于通信的多智能体强化学习」进展综述

专知

30+阅读 · 2022年11月12日

《使用机器学习智能体设计基于模拟的空战飞行员训练系统》2022瑞典林雪平大学页论文

《使用机器学习智能体设计基于模拟的空战飞行员训练系统》2022瑞典林雪平大学页论文

专知

37+阅读 · 2022年10月30日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知

57+阅读 · 2022年8月25日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

【干货书】《机器学习动力系统与控制》，572页pdf

【干货书】《机器学习动力系统与控制》，572页pdf

专知

35+阅读 · 2022年1月8日

【KDD2020-Tutorial】深度学习异常检测，180页ppt

【KDD2020-Tutorial】深度学习异常检测，180页ppt

专知

49+阅读 · 2020年8月28日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

36+阅读 · 2020年5月2日

相关基金

基于主动轮廓模型的海洋航空遥感图像的边缘检测模型和最优化策略研究

国家自然科学基金

2+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

基于多轴飞行器航拍数据的植物生长分析与建模

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度表达和迁移学习的人体检测研究

国家自然科学基金

6+阅读 · 2015年12月31日

移动增强现实中基于视觉—惯性传感器的混合跟踪方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

11+阅读 · 2015年12月31日

基于虚拟原型的信息物理融合系统高效可信构造研究

国家自然科学基金

7+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

大数据环境下基于GMDH的客户分类半监督集成模型研究

国家自然科学基金

1+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

476+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

147+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

173+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员