翻译标题：高效的蒙特卡罗树搜索物体操作规划翻译摘要：本文提出了一种高效的物体操作规划方法，使用蒙特卡罗树搜索（MCTS）来找到接触序列以及一种高效的基于ADMM的轨迹优化算法来评估候选接触序列的动态可行性。为了加速MCTS，我们提出了一种学习目标条件策略-价值网络以指导搜索方向有前途的节点的方法。此外，操作特定的启发式策略还能够大大减少搜索空间。在物理模拟器和实际硬件上进行了系统的物体操作实验，证明了我们方法的效率。特别是，通过学习的策略-价值网络，我们的方法在长序列的操作规划中表现出优越的扩展性，显著提高了规划成功率。 (Efficient Object Manipulation Planning with Monte Carlo Tree Search) - 专知论文

会员服务 ·

0

蒙特卡洛树搜索 · 蒙特卡罗 · Networking · Learning · 可约的 ·

2023 年 3 月 19 日

Efficient Object Manipulation Planning with Monte Carlo Tree Search

翻译：翻译标题：高效的蒙特卡罗树搜索物体操作规划翻译摘要：本文提出了一种高效的物体操作规划方法，使用蒙特卡罗树搜索（MCTS）来找到接触序列以及一种高效的基于ADMM的轨迹优化算法来评估候选接触序列的动态可行性。为了加速MCTS，我们提出了一种学习目标条件策略-价值网络以指导搜索方向有前途的节点的方法。此外，操作特定的启发式策略还能够大大减少搜索空间。在物理模拟器和实际硬件上进行了系统的物体操作实验，证明了我们方法的效率。特别是，通过学习的策略-价值网络，我们的方法在长序列的操作规划中表现出优越的扩展性，显著提高了规划成功率。

Huaijiang Zhu,Avadesh Meduri,Ludovic Righetti

This paper presents an efficient approach to object manipulation planning using Monte Carlo Tree Search (MCTS) to find contact sequences and an efficient ADMM-based trajectory optimization algorithm to evaluate the dynamic feasibility of candidate contact sequences. To accelerate MCTS, we propose a methodology to learn a goal-conditioned policy-value network to direct the search towards promising nodes. Further, manipulation-specific heuristics enable to drastically reduce the search space. Systematic object manipulation experiments in a physics simulator and on real hardware demonstrate the efficiency of our approach. In particular, our approach scales favorably for long manipulation sequences thanks to the learned policy-value network, significantly improving planning success rate.

翻译：

0

相关内容

蒙特卡洛树搜索

蒙特卡洛树搜索

【干货书】Python强化学习算法:学习、理解和开发智能算法以应对人工智能挑战，356页pdf，附代码

【干货书】Python强化学习算法:学习、理解和开发智能算法以应对人工智能挑战，356页pdf，附代码

专知会员服务

58+阅读 · 2022年12月10日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知会员服务

68+阅读 · 2022年7月20日

【硬核书】规划算法 (Planning Algorithm)，1023页pdf，Steven M. Illinois大学

【硬核书】规划算法 (Planning Algorithm)，1023页pdf，Steven M. Illinois大学

专知会员服务

167+阅读 · 2022年4月10日

【MIla】一种意识启发规划的基于模型强化学习，A Consciousness-Inspired Planning Agent for Model-Based Reinforcement Learning

【MIla】一种意识启发规划的基于模型强化学习，A Consciousness-Inspired Planning Agent for Model-Based Reinforcement Learning

专知会员服务

24+阅读 · 2022年3月19日

强化学习组合优化综述论文

专知会员服务

62+阅读 · 2021年6月1日

【TPAMI2020】目标检测中的不平衡问题:综述论文，34页pdf

专知会员服务

55+阅读 · 2020年3月16日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

50+阅读 · 2019年10月17日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

182+阅读 · 2019年10月11日

【加州大学伯克利分校博士论文】通过自我监督预测学习泛化

【加州大学伯克利分校博士论文】通过自我监督预测学习泛化

专知会员服务

65+阅读 · 2019年10月9日

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

专知会员服务

41+阅读 · 2019年10月9日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

【泡泡一分钟】优化对比度增强以提高SLAM重定位环境中视觉跟踪的稳健性

【泡泡一分钟】优化对比度增强以提高SLAM重定位环境中视觉跟踪的稳健性

泡泡机器人SLAM

10+阅读 · 2019年4月26日

【泡泡一分钟】DS-SLAM: 动态环境下的语义视觉SLAM

【泡泡一分钟】DS-SLAM: 动态环境下的语义视觉SLAM

泡泡机器人SLAM

23+阅读 · 2019年1月18日

逆强化学习-学习人先验的动机

逆强化学习-学习人先验的动机

CreateAMind

16+阅读 · 2019年1月18日

【泡泡一分钟】基于运动估计的激光雷达和相机标定方法

【泡泡一分钟】基于运动估计的激光雷达和相机标定方法

泡泡机器人SLAM

25+阅读 · 2019年1月17日

【泡泡一分钟】用于评估视觉惯性里程计的TUM VI数据集

【泡泡一分钟】用于评估视觉惯性里程计的TUM VI数据集

泡泡机器人SLAM

11+阅读 · 2019年1月4日

无监督元学习表示学习

无监督元学习表示学习

CreateAMind

27+阅读 · 2019年1月4日

【泡泡点云时空】基于增量分割的3D点云定位方法（ICRA2018-4）

【泡泡点云时空】基于增量分割的3D点云定位方法（ICRA2018-4）

泡泡机器人SLAM

13+阅读 · 2018年10月7日

【泡泡点云时空】用于点云识别的注意力形状上下文网络（CVPR2018-1）

【泡泡点云时空】用于点云识别的注意力形状上下文网络（CVPR2018-1）

泡泡机器人SLAM

33+阅读 · 2018年8月6日

【泡泡一分钟】神经SLAM：使用外部存储器让智能体学习探索环境

【泡泡一分钟】神经SLAM：使用外部存储器让智能体学习探索环境

泡泡机器人SLAM

12+阅读 · 2018年4月17日

Hamilton-Jacibi方程的弱KAM理论

国家自然科学基金

2+阅读 · 2017年12月31日

非共面放射治疗中的多机器人协作无碰撞轨迹规划与优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

大规模RFID系统标签的自适应高效准确识别策略研究

国家自然科学基金

0+阅读 · 2014年12月31日

遍历理论中的复杂性与族

国家自然科学基金

1+阅读 · 2013年12月31日

基于虚拟突变与结合自由能计算的抗体亲和力体外成熟

国家自然科学基金

0+阅读 · 2013年12月31日

盲环境中基于触觉信息的灵巧手实时抓取策略的研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于分形人工电磁材料的阵列天线RCS缩减技术研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于格理论可证明安全公钥密码算法的研究与设计

国家自然科学基金

0+阅读 · 2012年12月31日

以TolC蛋白为靶标的大肠杆菌外排泵抑制剂的筛选及耐药干预机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

数值求解最优控制：动态规划方法

国家自然科学基金

1+阅读 · 2009年12月31日

Cover Your Bases: How to Minimize the Sequencing Coverage in DNA Storage Systems

Arxiv

0+阅读 · 2023年5月9日

Backpropagation-free Training of Deep Physical Neural Networks

Arxiv

0+阅读 · 2023年5月9日

Understanding why SLAM algorithms fail in modern indoor environments

Arxiv

0+阅读 · 2023年5月9日

Learnable Behavior Control: Breaking Atari Human World Records via Sample-Efficient Behavior Selection

Arxiv

0+阅读 · 2023年5月9日

PillarNeXt: Rethinking Network Designs for 3D Object Detection in LiDAR Point Clouds

Arxiv

0+阅读 · 2023年5月8日

Efficient Query Re-optimization with Judicious Subquery Selections

Arxiv

0+阅读 · 2023年5月8日

DeformerNet: Learning Bimanual Manipulation of 3D Deformable Objects

Arxiv

0+阅读 · 2023年5月8日

Transformers are Meta-Reinforcement Learners

Arxiv

15+阅读 · 2022年6月14日

NeuroFluid: Fluid Dynamics Grounding with Particle-Driven Neural Radiance Fields

Arxiv

14+阅读 · 2022年3月3日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

VIP会员

文章信息

相关主题

蒙特卡洛树搜索

相关VIP内容

【干货书】Python强化学习算法:学习、理解和开发智能算法以应对人工智能挑战，356页pdf，附代码

【干货书】Python强化学习算法:学习、理解和开发智能算法以应对人工智能挑战，356页pdf，附代码

专知会员服务

58+阅读 · 2022年12月10日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知会员服务

68+阅读 · 2022年7月20日

【硬核书】规划算法 (Planning Algorithm)，1023页pdf，Steven M. Illinois大学

【硬核书】规划算法 (Planning Algorithm)，1023页pdf，Steven M. Illinois大学

专知会员服务

167+阅读 · 2022年4月10日

【MIla】一种意识启发规划的基于模型强化学习，A Consciousness-Inspired Planning Agent for Model-Based Reinforcement Learning

【MIla】一种意识启发规划的基于模型强化学习，A Consciousness-Inspired Planning Agent for Model-Based Reinforcement Learning

专知会员服务

24+阅读 · 2022年3月19日

强化学习组合优化综述论文

专知会员服务

62+阅读 · 2021年6月1日

【TPAMI2020】目标检测中的不平衡问题:综述论文，34页pdf

专知会员服务

55+阅读 · 2020年3月16日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

50+阅读 · 2019年10月17日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

182+阅读 · 2019年10月11日

【加州大学伯克利分校博士论文】通过自我监督预测学习泛化

【加州大学伯克利分校博士论文】通过自我监督预测学习泛化

专知会员服务

65+阅读 · 2019年10月9日

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

专知会员服务

41+阅读 · 2019年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

《城市滨海地区：理解复杂多变环境下的指挥控制框架》50页报告

《理解城市战及其在俄乌战争中的表现》报告

美空军“顶点2025”实验：推进AI在C2、动态目标锁定与联盟集成中的应用

《建设式兵棋模拟作为战术集群配置优化的关键组成部分》

相关资讯

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

【泡泡一分钟】优化对比度增强以提高SLAM重定位环境中视觉跟踪的稳健性

【泡泡一分钟】优化对比度增强以提高SLAM重定位环境中视觉跟踪的稳健性

泡泡机器人SLAM

10+阅读 · 2019年4月26日

【泡泡一分钟】DS-SLAM: 动态环境下的语义视觉SLAM

【泡泡一分钟】DS-SLAM: 动态环境下的语义视觉SLAM

泡泡机器人SLAM

23+阅读 · 2019年1月18日

逆强化学习-学习人先验的动机

逆强化学习-学习人先验的动机

CreateAMind

16+阅读 · 2019年1月18日

【泡泡一分钟】基于运动估计的激光雷达和相机标定方法

【泡泡一分钟】基于运动估计的激光雷达和相机标定方法

泡泡机器人SLAM

25+阅读 · 2019年1月17日

【泡泡一分钟】用于评估视觉惯性里程计的TUM VI数据集

【泡泡一分钟】用于评估视觉惯性里程计的TUM VI数据集

泡泡机器人SLAM

11+阅读 · 2019年1月4日

无监督元学习表示学习

无监督元学习表示学习

CreateAMind

27+阅读 · 2019年1月4日

【泡泡点云时空】基于增量分割的3D点云定位方法（ICRA2018-4）

【泡泡点云时空】基于增量分割的3D点云定位方法（ICRA2018-4）

泡泡机器人SLAM

13+阅读 · 2018年10月7日

【泡泡点云时空】用于点云识别的注意力形状上下文网络（CVPR2018-1）

【泡泡点云时空】用于点云识别的注意力形状上下文网络（CVPR2018-1）

泡泡机器人SLAM

33+阅读 · 2018年8月6日

【泡泡一分钟】神经SLAM：使用外部存储器让智能体学习探索环境

【泡泡一分钟】神经SLAM：使用外部存储器让智能体学习探索环境

泡泡机器人SLAM

12+阅读 · 2018年4月17日

相关论文

Cover Your Bases: How to Minimize the Sequencing Coverage in DNA Storage Systems

Arxiv

0+阅读 · 2023年5月9日

Backpropagation-free Training of Deep Physical Neural Networks

Arxiv

0+阅读 · 2023年5月9日

Understanding why SLAM algorithms fail in modern indoor environments

Arxiv

0+阅读 · 2023年5月9日

Learnable Behavior Control: Breaking Atari Human World Records via Sample-Efficient Behavior Selection

Arxiv

0+阅读 · 2023年5月9日

PillarNeXt: Rethinking Network Designs for 3D Object Detection in LiDAR Point Clouds

Arxiv

0+阅读 · 2023年5月8日

Efficient Query Re-optimization with Judicious Subquery Selections

Arxiv

0+阅读 · 2023年5月8日

DeformerNet: Learning Bimanual Manipulation of 3D Deformable Objects

Arxiv

0+阅读 · 2023年5月8日

Transformers are Meta-Reinforcement Learners

Arxiv

15+阅读 · 2022年6月14日

NeuroFluid: Fluid Dynamics Grounding with Particle-Driven Neural Radiance Fields

Arxiv

14+阅读 · 2022年3月3日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

相关基金

Hamilton-Jacibi方程的弱KAM理论

国家自然科学基金

2+阅读 · 2017年12月31日

非共面放射治疗中的多机器人协作无碰撞轨迹规划与优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

大规模RFID系统标签的自适应高效准确识别策略研究

国家自然科学基金

0+阅读 · 2014年12月31日

遍历理论中的复杂性与族

国家自然科学基金

1+阅读 · 2013年12月31日

基于虚拟突变与结合自由能计算的抗体亲和力体外成熟

国家自然科学基金

0+阅读 · 2013年12月31日

盲环境中基于触觉信息的灵巧手实时抓取策略的研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于分形人工电磁材料的阵列天线RCS缩减技术研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于格理论可证明安全公钥密码算法的研究与设计

国家自然科学基金

0+阅读 · 2012年12月31日

以TolC蛋白为靶标的大肠杆菌外排泵抑制剂的筛选及耐药干预机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

数值求解最优控制：动态规划方法

国家自然科学基金

1+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员