摘要:复杂未知环境下智能感知与自动控制是目前机器人在控制领域的研究热点之一,而新一代人工智能为其实现智能自动化赋予了可能.近年来,在高维连续状态-动作空间中,尝试运用深度强化学习进行机器人运动控制的新兴方法受到了相关研究人员的关注.本篇综述首先回顾了深度强化学习的兴起与发展,将用于机器人运动控制的深度强化学习算法分为基于值函数和策略梯度2类,并对各自典型算法及其特点进行了详细介绍;其次,针对仿真至现实之前的学习过程,简要介绍了5种常用于深度强化学习的机器人运动控制仿真平台;然后根据研究类型的不同,综述了目前基于深度强化学习的机器人运动控制方法在自主导航、物体抓取、步态控制、人机协作以及群体协同等5个方面的研究进展.最后,对其未来所面临的挑战以及发展趋势进行了总结与展望.
http://kzyjc.cnjournals.com/kzyjc/article/pdf/2020-1382
随着机器人在制造、服务、医疗以及军事等领 域的应用拓宽,对其环境感知、行动决策以及自主 学习等能力的智能程度需求也日益增长.2017年,国 务院在《新一代人工智能发展规划》中也提出对复 杂环境下机器人自主控制等智能技术研究的迫切要 求.人工智能正处于创新发展的大好时代,将为新一 轮科技与产业革命汇聚发展注入新动能,同时也为新一代智能机器人实现智能感知与自动控制赋予更多 可能.而如今,利用深度强化学习(Deep Reinforcement Learning, DRL)方法进行机器人运动控制正作为一个 新兴研究领域吸引着越来越多研究人员的注意.
本文主要内容如下,在第1、2部分,从算法和平 台两部分对相关研究基础进行介绍,首先阐述DRL的 兴起与发展,介绍用于机器人运动控制的典型算法 及其特点;其次对常用于DRL的机器人运动控制仿 真平台进行简要介绍;而第3部分,则根据研究类型的 不同,对基于DRL的机器人运动控制方法在自主导 航、物体抓取、步态控制、人机协作以及群体协同 等五个方面的研究进展进行综述.最后,在第4部分结 合DRL的发展方向,对其解决复杂未知环境下的机器 人运动控制问题所面临的挑战以及未来发展趋势进行总结与展望.
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“DRLR” 就可以获取《基于深度强化学习的机器人运动控制研究进展》专知下载链接