分层强化学习在无人机领域应用综述 - 专知VIP

会员服务 ·

31

无人机 · AI与军事 · 分层强化学习 ·

2024 年 3 月 19 日

分层强化学习在无人机领域应用综述

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

分层强化学习是强化学习领域的一个重要分支。基于分而治之的思想，将一个复杂问题分解成多个子问题，最终解决整个问题。近年来，由于传感器能力的提高和人工智能算法的进步，基于分层强化学习的无人机自主导航成为研究热点。本篇文章对国内外发表的具有代表性的文章进行概述，首先分析无人机和分层强化学习的含义，其次重点研究了分层强化学习在无人机轨迹规划和资源分配的优化问题上的应用。强化学习在无人机领域开始广泛的适用。近年来，无人驾驶飞行器(以下简称无人机)因灵活性高、成本低等优点。在军事和民用领域得到了广泛的应用。包括探查和搜索、环境侦测、救援任务等。当无人机在处理具体问题时，例如传统的无人机导航方法需要通过构建精确的环境或依赖专家经验人为设置规则。或者作为通信中站传统的方法很难解决优化问题。不同于传统的方法，基于强化学习的方法在于它能够通过不断的试错和学习，优化无人机的决策策略，使其能够更好地适应不同的环境和任务。其次，强化学习可以使无人机具备自主学习和适应能力，而无需人工预先编程所有可能的情况和行为。这种自主学习能力使得无人机更灵活、智能，并能够应对未知或复杂的环境。特别是近年来深度强化学习取得了快速发展，利用深度学习强大的感知与拟合能力学习高维环境状态到控制动作之间的映射，从而能够获得更好的策略。

分层强化学习可以解决强化学习中稀疏奖励的问题。强化学习中，在一个复杂的环境中学习一项任务，其中稀疏奖励是一个问题，这对人工智能来说是一个重大挑战，与一般的优化固定结构系统参数的强化学习方法不同，分层强化学习通过优化系统结构来解决稀疏奖励的问题。如果能在多个时空抽象层次上表示所学知识，或者提供确切的奖励信号和及时的反馈，来指导智能体有效地朝着目标学习。在强化学习术语中，这就演变成多目标结构指导的分层学习过程，从而产生了分层强化学习的概念。因此，分层强化学习本质上迎合了稀疏奖励问题，并方便地适应了一类涉及多个任务的问题，这些问题具有良好的定义。和一般的优化固定结构系统参数的强化学习方法不同，分层强化学习通过优化系统结构来提高算法性能。

成为VIP会员查看完整内容

53

相关内容

无人机

不需要驾驶员登机驾驶的各式遥控飞行器。

基于深度学习的无人机目标检测研究综述

基于深度学习的无人机目标检测研究综述

专知会员服务

101+阅读 · 2023年6月22日

深度学习在雷达目标检测中的应用综述

深度学习在雷达目标检测中的应用综述

专知会员服务

61+阅读 · 2023年2月8日

多模态数据的行为识别综述

多模态数据的行为识别综述

专知会员服务

87+阅读 · 2022年11月30日

基于深度学习的视觉目标检测技术综述

基于深度学习的视觉目标检测技术综述

专知会员服务

60+阅读 · 2022年6月22日

基于深度学习的图像目标检测算法综述

基于深度学习的图像目标检测算法综述

专知会员服务

98+阅读 · 2022年4月15日

深度学习驱动的知识追踪研究进展综述

深度学习驱动的知识追踪研究进展综述

专知会员服务

38+阅读 · 2021年11月15日

基于深度学习的显著性目标检测方法综述

专知会员服务

36+阅读 · 2021年8月27日

基于深度学习的数据融合方法研究综述

基于深度学习的数据融合方法研究综述

专知会员服务

146+阅读 · 2020年12月10日

基于深度学习的图像补全算法综述

专知会员服务

46+阅读 · 2020年12月4日

基于深度学习的手语识别综述

基于深度学习的手语识别综述

专知会员服务

47+阅读 · 2020年5月18日

深度学习研究及军事应用综述

深度学习研究及军事应用综述

专知

23+阅读 · 2022年7月7日

航空制造知识图谱构建研究综述

航空制造知识图谱构建研究综述

专知

35+阅读 · 2022年4月26日

清华大学：从单体仿生到群体智能

清华大学：从单体仿生到群体智能

专知

18+阅读 · 2022年2月9日

智能合约的形式化验证方法研究综述

智能合约的形式化验证方法研究综述

专知

16+阅读 · 2021年5月8日

多模态情绪识别研究综述

多模态情绪识别研究综述

专知

24+阅读 · 2020年12月21日

基于深度学习的数据融合方法研究综述

基于深度学习的数据融合方法研究综述

专知

33+阅读 · 2020年12月10日

深度学习可解释性研究进展

深度学习可解释性研究进展

专知

19+阅读 · 2020年6月26日

综述 | 近年来深度学习的重要研究成果（附PDF）

综述 | 近年来深度学习的重要研究成果（附PDF）

数据派THU

14+阅读 · 2018年8月15日

智能无人机集群技术概述

智能无人机集群技术概述

无人机

42+阅读 · 2018年2月28日

贝叶斯机器学习前沿进展

贝叶斯机器学习前沿进展

架构文摘

13+阅读 · 2018年2月11日

基于RGB-D数据的个性化手势交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

纳米分辨率显微视频的像素级数据挖掘研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维不平衡数据的集成学习算法研究

国家自然科学基金

13+阅读 · 2015年12月31日

基于极限学习单元的多生物特征图像深度学习建模与识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向生物特征识别的鲁棒判别结构化特征表示方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于异构信息网络的地理共享数据个性化检索研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的群体偏好决策分析研究

国家自然科学基金

5+阅读 · 2014年12月31日

基于领域知识和链路预测的个性化推荐研究

国家自然科学基金

4+阅读 · 2014年12月31日

社交学习网络环境下的创新能力理论与应用研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

214+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

81+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

473+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

146+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

172+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

VIP会员

相关主题

分层强化学习

相关VIP内容

基于深度学习的无人机目标检测研究综述

基于深度学习的无人机目标检测研究综述

专知会员服务

101+阅读 · 2023年6月22日

深度学习在雷达目标检测中的应用综述

深度学习在雷达目标检测中的应用综述

专知会员服务

61+阅读 · 2023年2月8日

多模态数据的行为识别综述

多模态数据的行为识别综述

专知会员服务

87+阅读 · 2022年11月30日

基于深度学习的视觉目标检测技术综述

基于深度学习的视觉目标检测技术综述

专知会员服务

60+阅读 · 2022年6月22日

基于深度学习的图像目标检测算法综述

基于深度学习的图像目标检测算法综述

专知会员服务

98+阅读 · 2022年4月15日

深度学习驱动的知识追踪研究进展综述

深度学习驱动的知识追踪研究进展综述

专知会员服务

38+阅读 · 2021年11月15日

基于深度学习的显著性目标检测方法综述

专知会员服务

36+阅读 · 2021年8月27日

基于深度学习的数据融合方法研究综述

基于深度学习的数据融合方法研究综述

专知会员服务

146+阅读 · 2020年12月10日

基于深度学习的图像补全算法综述

专知会员服务

46+阅读 · 2020年12月4日

基于深度学习的手语识别综述

基于深度学习的手语识别综述

专知会员服务

47+阅读 · 2020年5月18日

热门VIP内容

开通专知VIP会员享更多权益服务

新质生成式AI赋能产业变革的实践与路径

用于多模态大模型的离散标记化：全面综述

Nature综述：金融网络中的物理学

【CMU博士论文】通信高效且差分隐私的优化方法

相关资讯

深度学习研究及军事应用综述

深度学习研究及军事应用综述

专知

23+阅读 · 2022年7月7日

航空制造知识图谱构建研究综述

航空制造知识图谱构建研究综述

专知

35+阅读 · 2022年4月26日

清华大学：从单体仿生到群体智能

清华大学：从单体仿生到群体智能

专知

18+阅读 · 2022年2月9日

智能合约的形式化验证方法研究综述

智能合约的形式化验证方法研究综述

专知

16+阅读 · 2021年5月8日

多模态情绪识别研究综述

多模态情绪识别研究综述

专知

24+阅读 · 2020年12月21日

基于深度学习的数据融合方法研究综述

基于深度学习的数据融合方法研究综述

专知

33+阅读 · 2020年12月10日

深度学习可解释性研究进展

深度学习可解释性研究进展

专知

19+阅读 · 2020年6月26日

综述 | 近年来深度学习的重要研究成果（附PDF）

综述 | 近年来深度学习的重要研究成果（附PDF）

数据派THU

14+阅读 · 2018年8月15日

智能无人机集群技术概述

智能无人机集群技术概述

无人机

42+阅读 · 2018年2月28日

贝叶斯机器学习前沿进展

贝叶斯机器学习前沿进展

架构文摘

13+阅读 · 2018年2月11日

相关基金

基于RGB-D数据的个性化手势交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

纳米分辨率显微视频的像素级数据挖掘研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维不平衡数据的集成学习算法研究

国家自然科学基金

13+阅读 · 2015年12月31日

基于极限学习单元的多生物特征图像深度学习建模与识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向生物特征识别的鲁棒判别结构化特征表示方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于异构信息网络的地理共享数据个性化检索研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的群体偏好决策分析研究

国家自然科学基金

5+阅读 · 2014年12月31日

基于领域知识和链路预测的个性化推荐研究

国家自然科学基金

4+阅读 · 2014年12月31日

社交学习网络环境下的创新能力理论与应用研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

214+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

81+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

473+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

146+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

172+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员