机器人因其高效的感知、决策和执行能力,在人工智能、信息技术和智能制造等领域中具有巨大的应用价值。目前,机器人学习与控制已成为机器人研究领域的重要前沿技术之一。各种基于神经网络的智能算法被设计,从而为机器人系统提供同步学习与控制的规划框架。首先从神经动力学(ND)算法、前馈神经网络(FNNs)、递归神经网络(RNNs)和强化学习(RL)四个方面介绍了基于神经网络的机器人学习与控制的研究现状,回顾了近30年来面向机器人学习与控制的智能算法和相关应用技术。最后展望了该领域存在的问题和发展趋势,以期促进机器人学习与控制理论的推广及应用场景的拓展。

它具有感知能力、决策能力和执行能力,能够协助 甚至替代人类完成各种复杂、繁重和危险的任务。 任何涉及重复性工作的工业系统都可以通过机器人 实现自动化作业,进而在降低人力成本的同时显著 地提高生产效率和产品质量[1] 。这也预示着现代 智能工厂能够根据需求扩大或缩小生产规模。典型 的机器人设备包括冗余度机器人[2] 、柔性机器人[3] 和移动机器人[4]等。近年来,机器人在军事战争、 太空探索、医疗手术和其他重要行业中得到了广泛 的应用[5-7] 。 在第四次工业革命的推动下,机器人系统,特 别是机械臂,受到世界各国的广泛关注[8] 。机器人 技术与多学科技术相结合,逐步推动了人类社会生 产和生活方式的转变。以机器人视觉和触觉为代表 的机器人感知技术加速了机器人学习与控制概念的 产生和发展[9] 。因此,机器人系统能够克服源于自 身或环境的不确定性因素,从而提高任务执行的效 率和稳定性。具体而言,机器人需要解决由磨损、 老化、故障等因素引起的结构不确定性问题和由环 境、任务等因素决定的决策问题[10] 。因此,亟需开 发其自我学习和实时校准功能。近年来,相关的学 习技术提高了具有不确定性的机器人系统的容错能 力和决策能力[10-12] 。另一方面,在任务执行过程 中,机器人期望保持稳定且高效的工作性能。因 此,它需要基于特定的控制方案和高效的网络算法 以实时获得合适的控制信号。这要求机器人系统具 备优越的容错能力和可靠的控制精度,并在此基础 上以人工智能的模式实现复杂多变的任务[13-14] 。 近年来,脑机接口技术[15] 、手术机器人[16] 、康复 机器人[17-18] 、多机器人集群[19] 等新兴概念的发展 对机器人控制技术与应用提出了实时性、精确性、 稳定性、容错性、鲁棒性等多方面实际要求。随后 出现了一系列先进的控制技术,如远中心控制[20] 、 视觉伺服控制[21] 、模型预测控制[22] 、阻抗控制[23] 。 因此,探索机器人学习与运动控制相结合的新模式 是近年来国内外机器人研究的重点。 基于神经网络的机器人学习与控制技术已成为 前沿科技之一,也是智能制造、智慧医疗和无人驾 驶领域中的重要瓶颈技术之一。近 30年来,相关 的研究成果显著地提高了机器人系统的功能性、精 确性和智能性[24] 。机器人学习技术利用数据驱动 方法分析、预测和估计带有不确定性的模型或策 略[25] ;机器人控制技术结合学习信息与控制算法 实现功能性运动规划[26] 。在多源传感器的协助下, 机器人系统可以收集、处理和开发数据,进而集成 数据库,甚至搭建数据云[27] 。随后,基于神经网络 的机器人算法根据测量数据实现优化的学习与控制 过程。 神经网络具备强大的拟合能力和并行处理能 力,可以被理解为机器人的“大脑” 。面向机器人学 习与控制的主流神经网络方法包括神经动力学 (neuraldynamics,ND)方法[28-32] 、前馈神经网络 (feedforwardneuralnetwork,FNN)方法[33-34] 、递归 神经网络(recurrentneuralnetwork,RNN)方法[35-36] 和强化学习(reinforcementlearning,RL)方法[11,37] 。 ND方法通过构建常微分方程(ordinarydifferential equation,ODE)形式或对应的离散变体系统以求解 机器人学习与控制问题,并实现实时参数辨识[28-30] 和机器人控制[31-32] 。FNN方法属于一种机器学习 算法,能够通过更新权值逼近机器人系统的特定函 数,从而开发相应的数据驱动技术[33-34] 。与 FNN 方法不同,RNN方法的网络节点之间可以构建循环 连接,允许一些节点的输出影响其后续输入,在机 器人学习领域有显著的应用价值[35-36] 。值得注意 的是,ND方法和 RNN方法在结构上存在交集。当 ODE形式的计算网络的输入神经节点数大于或等 于 2时,该系统即属于 RNN方法,也可被称为 ND 方法[38] 。为了便于阐述,本文分别对 ND方法与 RNN方法进行单独介绍。RL方法能够解决机器人 与环境交互过程中的决策问题,并通过试错的方式 实现机器人特定技能的学习[11,37] 。以上 4种机器 人学习算法均属于人工智能算法的范畴[39] 。其主 要任务是开发智能信息处理应用,从而设计与人类 智能相似的机器人系统。在真实场景中,机器人的 交互过程产生的学习与控制问题通常需要多种技术 协同解决[40] 。这要求机器人系统通过传感器获取 大量的测量数据,进而驱动学习和控制过程。因此, 机器人学习与控制系统的发展必然伴随着传感器技 术、神经网络方法、数学理论等重要技术的进步[41] 。 如图 1所示,本文回顾了用于解决机器人学习 与控制问题的神经网络方法以及相关应用,其中, 机器人学习包括机器人模型学习和机器人策略学习 两个方面。相关的神经网络方法被归纳为 ND方 法、FNN方法、RNN方法和 RL方法.

成为VIP会员查看完整内容
32

相关内容

人工神经网络(Artificial Neural Network,即ANN ),是20世纪80 年代以来人工智能领域兴起的研究热点。它从信息处理角度对人脑神经元网络进行抽象, 建立某种简单模型,按不同的连接方式组成不同的网络。在工程与学术界也常直接简称为神经网络或类神经网络。神经网络是一种运算模型,由大量的节点(或称神经元)之间相互联接构成。每个节点代表一种特定的输出函数,称为激励函数(activation function)。每两个节点间的连接都代表一个对于通过该连接信号的加权值,称之为权重,这相当于人工神经网络的记忆。网络的输出则依网络的连接方式,权重值和激励函数的不同而不同。而网络自身通常都是对自然界某种算法或者函数的逼近,也可能是对一种逻辑策略的表达。 最近十多年来,人工神经网络的研究工作不断深入,已经取得了很大的进展,其在模式识别、智能机器人、自动控制、预测估计、生物、医学、经济等领域已成功地解决了许多现代计算机难以解决的实际问题,表现出了良好的智能特性。
深度学习在体育应用中的研究概览:感知、理解和决策
专知会员服务
37+阅读 · 2023年7月17日
基于内在动机的深度强化学习探索方法综述
专知会员服务
39+阅读 · 2023年5月13日
面向无人机的视觉目标跟踪算法:综述与展望
专知会员服务
71+阅读 · 2023年2月28日
「强化学习在无人车领域」的应用与展望
专知会员服务
52+阅读 · 2022年12月8日
基于深度学习的视觉目标检测技术综述
专知会员服务
58+阅读 · 2022年6月22日
基于深度学习的计算机视觉研究新进展
专知会员服务
150+阅读 · 2022年4月21日
基于深度学习的图像目标检测算法综述
专知会员服务
97+阅读 · 2022年4月15日
人工智能系统可信性度量评估研究综述
专知会员服务
87+阅读 · 2022年1月30日
基于深度神经网络的高效视觉识别研究进展与新方向
专知会员服务
38+阅读 · 2021年8月31日
专知会员服务
132+阅读 · 2021年2月17日
深度学习模型可解释性的研究进展
专知
25+阅读 · 2020年8月1日
孟小峰:机器学习与数据库技术融合
计算机研究与发展
14+阅读 · 2018年9月6日
基于深度学习的目标检测算法综述
AI研习社
14+阅读 · 2018年4月25日
【观点】计算机视觉:历史、现状和发展趋势|胡占义研究员
中国科学院自动化研究所
12+阅读 · 2017年11月21日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
15+阅读 · 2012年12月31日
国家自然科学基金
45+阅读 · 2009年12月31日
Arxiv
155+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
397+阅读 · 2023年3月31日
Arxiv
66+阅读 · 2023年3月26日
Arxiv
137+阅读 · 2023年3月24日
VIP会员
相关VIP内容
深度学习在体育应用中的研究概览:感知、理解和决策
专知会员服务
37+阅读 · 2023年7月17日
基于内在动机的深度强化学习探索方法综述
专知会员服务
39+阅读 · 2023年5月13日
面向无人机的视觉目标跟踪算法:综述与展望
专知会员服务
71+阅读 · 2023年2月28日
「强化学习在无人车领域」的应用与展望
专知会员服务
52+阅读 · 2022年12月8日
基于深度学习的视觉目标检测技术综述
专知会员服务
58+阅读 · 2022年6月22日
基于深度学习的计算机视觉研究新进展
专知会员服务
150+阅读 · 2022年4月21日
基于深度学习的图像目标检测算法综述
专知会员服务
97+阅读 · 2022年4月15日
人工智能系统可信性度量评估研究综述
专知会员服务
87+阅读 · 2022年1月30日
基于深度神经网络的高效视觉识别研究进展与新方向
专知会员服务
38+阅读 · 2021年8月31日
专知会员服务
132+阅读 · 2021年2月17日
相关资讯
深度学习模型可解释性的研究进展
专知
25+阅读 · 2020年8月1日
孟小峰:机器学习与数据库技术融合
计算机研究与发展
14+阅读 · 2018年9月6日
基于深度学习的目标检测算法综述
AI研习社
14+阅读 · 2018年4月25日
【观点】计算机视觉:历史、现状和发展趋势|胡占义研究员
中国科学院自动化研究所
12+阅读 · 2017年11月21日
相关基金
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
15+阅读 · 2012年12月31日
国家自然科学基金
45+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员