高精度操控的策略学习前沿研究

本论文致力于通过现代策略学习方法突破高精度操控任务的极限,系统性地解决了当前策略学习框架在全控制栈中的不足。我们首先揭示了高频控制对精确策略的关键作用:当任务容差阈值极小时,策略查询频率不足将导致响应能力缺失。针对离线强化学习(RL)原生不支持混合频率数据的局限,我们发现不同离散化频率会导致Q值传播速率差异,进而提出通过Q-step回报的离散化规模缩放来实现Q值更新速率一致性的创新方法。在三个机器人控制仿真任务中,该方法成功实现了跨频率泛化能力。 在模仿学习方面,我们通过仿真实验解耦物体几何属性与视觉特征,首次证实精确控制(而非视觉感知)是精细操作任务的主要瓶颈。针对典型模仿学习流程的系统分析揭示了三大障碍:(i) 传统损失函数在不同误差区间的非线性行为;(ii) 批次不足导致的梯度噪声超过任务精度要求;(iii) 收敛所需梯度步数过多。由此提出的"输出精度调优"方案整合了分段L1损失函数、梯度累积虚拟批次和输出层过训练三项技术,在六项真实世界精细操作任务中平均提升75%的性能表现。 针对基于大语言模型(LLM)的规划器,我们创新性地设计了兼容接触力约束的动作空间参数化方法。实验表明,通过融合目标位姿的交互刚度约束估计,LLM策略生成成功率较非兼容动作空间提升3-4倍,成功拓展了代码生成方法在接触密集型高精度任务中的应用边界。这项研究为突破感知噪声和抓取误差等现实条件限制下的精确控制提供了新范式。

成为VIP会员查看完整内容
15

相关内容

【博士论文】在缺失数据情况下的深度自监督学习
专知会员服务
30+阅读 · 2024年12月27日
【NUS博士论文】深度视觉算法的对抗鲁棒性研究
专知会员服务
32+阅读 · 2022年11月25日
专知会员服务
27+阅读 · 2021年8月24日
专知会员服务
82+阅读 · 2020年12月18日
【南京大学冯雯博士论文】新型深度学习模型的研究
专知会员服务
70+阅读 · 2020年12月5日
多模态情绪识别研究综述
专知
23+阅读 · 2020年12月21日
基于深度学习的数据融合方法研究综述
专知
32+阅读 · 2020年12月10日
【综述】多智能体强化学习算法理论研究
深度强化学习实验室
12+阅读 · 2020年9月9日
基于图神经网络的知识图谱研究进展
AI科技评论
20+阅读 · 2020年8月31日
深度学习可解释性研究进展
专知
19+阅读 · 2020年6月26日
深度多模态表示学习综述论文,22页pdf
专知
31+阅读 · 2020年6月21日
贝叶斯机器学习前沿进展
架构文摘
13+阅读 · 2018年2月11日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
27+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
23+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Arxiv
165+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
447+阅读 · 2023年3月31日
Arxiv
75+阅读 · 2023年3月26日
Arxiv
163+阅读 · 2023年3月24日
Arxiv
24+阅读 · 2023年3月17日
VIP会员
相关VIP内容
相关资讯
多模态情绪识别研究综述
专知
23+阅读 · 2020年12月21日
基于深度学习的数据融合方法研究综述
专知
32+阅读 · 2020年12月10日
【综述】多智能体强化学习算法理论研究
深度强化学习实验室
12+阅读 · 2020年9月9日
基于图神经网络的知识图谱研究进展
AI科技评论
20+阅读 · 2020年8月31日
深度学习可解释性研究进展
专知
19+阅读 · 2020年6月26日
深度多模态表示学习综述论文,22页pdf
专知
31+阅读 · 2020年6月21日
贝叶斯机器学习前沿进展
架构文摘
13+阅读 · 2018年2月11日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
27+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
23+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员