基于深度强化学习的机器人运动控制研究进展 - 专知VIP

会员服务 ·

24

复杂未知环境 · 人工智能 · 高维连续空间 · 深度强化学习 · 机器人运动控制 ·

2021 年 4 月 22 日

基于深度强化学习的机器人运动控制研究进展

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

摘要：复杂未知环境下智能感知与自动控制是目前机器人在控制领域的研究热点之一,而新一代人工智能为其实现智能自动化赋予了可能.近年来,在高维连续状态-动作空间中,尝试运用深度强化学习进行机器人运动控制的新兴方法受到了相关研究人员的关注.本篇综述首先回顾了深度强化学习的兴起与发展,将用于机器人运动控制的深度强化学习算法分为基于值函数和策略梯度2类,并对各自典型算法及其特点进行了详细介绍;其次,针对仿真至现实之前的学习过程,简要介绍了5种常用于深度强化学习的机器人运动控制仿真平台;然后根据研究类型的不同,综述了目前基于深度强化学习的机器人运动控制方法在自主导航、物体抓取、步态控制、人机协作以及群体协同等5个方面的研究进展.最后,对其未来所面临的挑战以及发展趋势进行了总结与展望.

http://kzyjc.cnjournals.com/kzyjc/article/pdf/2020-1382

成为VIP会员查看完整内容

65

相关内容

复杂未知环境

复杂未知环境

记忆增强型深度强化学习研究综述

专知会员服务

52+阅读 · 2021年4月6日

无模型强化学习研究综述

专知会员服务

134+阅读 · 2021年3月13日

强化学习的自动驾驶控制技术研究进展

专知会员服务

140+阅读 · 2021年2月17日

深度强化学习算法与应用研究现状综述

专知会员服务

138+阅读 · 2021年1月13日

基于深度强化学习的组合优化研究进展

专知会员服务

89+阅读 · 2020年12月11日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

27+阅读 · 2020年12月3日

基于深度学习的多标签生成研究进展

基于深度学习的多标签生成研究进展

专知

4+阅读 · 2020年4月25日

NeurIPS提前看 | 四篇论文，一窥元学习的最新研究进展

NeurIPS提前看 | 四篇论文，一窥元学习的最新研究进展

机器之心

12+阅读 · 2019年12月9日

从锚点到关键点：目标检测方法最新进展（2019）

从锚点到关键点：目标检测方法最新进展（2019）

GAN生成式对抗网络

14+阅读 · 2019年8月22日

【团队新作】深度强化学习进展: 从AlphaGo到AlphaGo Zero

【团队新作】深度强化学习进展: 从AlphaGo到AlphaGo Zero

中国科学院自动化研究所

19+阅读 · 2018年1月31日

Reinforcement Learning for Assignment Problem with Time Constraints

Arxiv

0+阅读 · 2021年6月5日

AdCo: Adversarial Contrast for Efficient Learning of Unsupervised Representations from Self-Trained Negative Adversaries

Arxiv

6+阅读 · 2021年1月26日

Meta-Learning with Implicit Gradients

Meta-Learning with Implicit Gradients

Arxiv

13+阅读 · 2019年9月10日

Hierarchical Deep Multiagent Reinforcement Learning

Hierarchical Deep Multiagent Reinforcement Learning

Arxiv

8+阅读 · 2018年9月25日

Reinforcement Learning for Solving the Vehicle Routing Problem

Arxiv

3+阅读 · 2018年5月21日

VIP会员

相关主题

复杂未知环境

高维连续空间

深度强化学习

机器人运动控制

相关VIP内容

记忆增强型深度强化学习研究综述

专知会员服务

52+阅读 · 2021年4月6日

无模型强化学习研究综述

专知会员服务

134+阅读 · 2021年3月13日

强化学习的自动驾驶控制技术研究进展

专知会员服务

140+阅读 · 2021年2月17日

深度强化学习算法与应用研究现状综述

专知会员服务

138+阅读 · 2021年1月13日

基于深度强化学习的组合优化研究进展

专知会员服务

89+阅读 · 2020年12月11日

热门VIP内容

开通专知VIP会员享更多权益服务

美海军作战管理系统：变革战场空间的二十年

《任务与武器驱动美海军舰队设计》报告

俄罗斯“沙希德”/“天竺葵”攻击无人机

《利用动态图对网络攻击进行建模与仿真：在云安全评估中的应用》90页

相关资讯

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

27+阅读 · 2020年12月3日

基于深度学习的多标签生成研究进展

基于深度学习的多标签生成研究进展

专知

4+阅读 · 2020年4月25日

NeurIPS提前看 | 四篇论文，一窥元学习的最新研究进展

NeurIPS提前看 | 四篇论文，一窥元学习的最新研究进展

机器之心

12+阅读 · 2019年12月9日

从锚点到关键点：目标检测方法最新进展（2019）

从锚点到关键点：目标检测方法最新进展（2019）

GAN生成式对抗网络

14+阅读 · 2019年8月22日

【团队新作】深度强化学习进展: 从AlphaGo到AlphaGo Zero

【团队新作】深度强化学习进展: 从AlphaGo到AlphaGo Zero

中国科学院自动化研究所

19+阅读 · 2018年1月31日

相关论文

Reinforcement Learning for Assignment Problem with Time Constraints

Arxiv

0+阅读 · 2021年6月5日

AdCo: Adversarial Contrast for Efficient Learning of Unsupervised Representations from Self-Trained Negative Adversaries

Arxiv

6+阅读 · 2021年1月26日

Meta-Learning with Implicit Gradients

Meta-Learning with Implicit Gradients

Arxiv

13+阅读 · 2019年9月10日

Hierarchical Deep Multiagent Reinforcement Learning

Hierarchical Deep Multiagent Reinforcement Learning

Arxiv

8+阅读 · 2018年9月25日

Reinforcement Learning for Solving the Vehicle Routing Problem

Arxiv

3+阅读 · 2018年5月21日

微信扫码咨询专知VIP会员