《基于技能的机器人系统学习：将规划和知识表示与强化学习相结合》博士论文 - 专知VIP

会员服务 ·

19

AI与军事 · 机器人和自主系统 · 知识表示 · 强化学习 · 博士论文 ·

2024 年 7 月 7 日

《基于技能的机器人系统学习：将规划和知识表示与强化学习相结合》博士论文

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

多年来，工厂里的机器人就像技术熟练但缺乏灵活性的工人，在完成特定任务时能力很强，但无法适应或学习新任务。它们使用复杂的、针对特定制造商的语言进行编程，因此专业性很强，但通用性不高。然而，随着我们步入第四次工业革命时代，对这些机器人工人的要求正在发生变化。现在，它们需要更像瑞士军刀：多才多艺、适应性强，随时准备迎接新的挑战。

在这里，"机器人技能 "的概念应运而生--可以把它们想象成机器人的应用程序。就像你在智能手机上下载应用程序来赋予它新的功能一样，机器人技能也是一种程序，可以通过混合和匹配来教授机器人新的任务。这些技能并非一招鲜；它们可重复使用，并可根据不同需求进行调整，从而使机器人编程更加灵活。

但是，这些机器人如何知道该做什么以及在哪里做呢？这就是 "世界模型 "的作用所在。它就像地图和指南合二为一，包含机器人所处环境和能力的相关信息。例如，如果要求机器人去取一杯咖啡，世界模型可以帮助它了解厨房在哪里、咖啡机在哪里以及如何操作。这就好比让机器人对自己的世界有一个基本的了解，并知道如何导航。

现在，教机器人新技能是一回事，但教它自学又如何呢？这正是我们的研究出现令人兴奋的转机的地方。我们正在使用强化学习--一种让机器人通过尝试和错误来学习的方法，就像人类学习一样。机器人会尝试不同的方法，从反馈中学习，并逐渐改进自己的策略。这就像婴儿学习走路一样，蹒跚学步，渐入佳境。

但问题是：教机器人学习并不简单。研究重点是让这一学习过程变得更简单、更高效，即使对于那些不是机器人专家的人来说也是如此。正在寻找加快学习速度的方法，比如给机器人 "提示"，或者在真实世界中进行尝试之前使用模拟器进行练习。此外，我们正在教机器人处理各种任务，而不是每次都从头开始。

方法结合了规划、机器人技能和学习，比传统方法快得多。正在模拟环境和真实机器人上测试这种方法，重点是涉及大量接触的任务，如操作物体或擦拭表面。

总之，不只是教机器人新的技巧，而是让它们能够学习和适应，使它们能够满足现代工业世界不断变化的需求。

图 8：SkiROS2 的结构。世界模型（WM）存储知识和关系。任务管理器创建任务级计划。图形用户界面（GUI）降低了与系统交互的门槛。

成为VIP会员查看完整内容

34

相关内容

AI与军事

人工智能在军事中可用于多项任务，例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。

《协作机器人的学习行为树》最新146页博士论文

《协作机器人的学习行为树》最新146页博士论文

专知会员服务

45+阅读 · 2024年2月7日

《利用深度多模态结构实现机器人可靠感知和定位》366页博士论文

《利用深度多模态结构实现机器人可靠感知和定位》366页博士论文

专知会员服务

43+阅读 · 2024年1月29日

【博士论文】结构化数据自动可视化关键技术研究

【博士论文】结构化数据自动可视化关键技术研究

专知会员服务

47+阅读 · 2023年12月6日

《利用边缘计算为物联网系统提供分布式智能》2023最新博士论文

《利用边缘计算为物联网系统提供分布式智能》2023最新博士论文

专知会员服务

48+阅读 · 2023年10月30日

《可解释深度学习视角》2023最新博士论文

《可解释深度学习视角》2023最新博士论文

专知会员服务

48+阅读 · 2023年9月5日

《人机协作决策优化》142页博士论文

《人机协作决策优化》142页博士论文

专知会员服务

176+阅读 · 2023年7月16日

博士论文 |《多智能体系统：协作辅助智能体和对对抗性攻击的鲁棒性》哈佛大学

博士论文 |《多智能体系统：协作辅助智能体和对对抗性攻击的鲁棒性》哈佛大学

专知会员服务

66+阅读 · 2023年2月27日

《基于形式化方法的多机器人系统规划与规范》2022博士论文

《基于形式化方法的多机器人系统规划与规范》2022博士论文

专知会员服务

41+阅读 · 2022年11月22日

《陆地机器人技术：军事和国防领域认知系统的集成》2022最新34页论文

《陆地机器人技术：军事和国防领域认知系统的集成》2022最新34页论文

专知会员服务

64+阅读 · 2022年11月21日

《利用多模态移动传感器数据对健康进行建模的机器学习》剑桥大学博士论文

《利用多模态移动传感器数据对健康进行建模的机器学习》剑桥大学博士论文

专知会员服务

76+阅读 · 2022年4月30日

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

专知

27+阅读 · 2022年11月23日

《使用机器学习智能体设计基于模拟的空战飞行员训练系统》2022瑞典林雪平大学页论文

《使用机器学习智能体设计基于模拟的空战飞行员训练系统》2022瑞典林雪平大学页论文

专知

37+阅读 · 2022年10月30日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

32+阅读 · 2022年10月17日

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

专知

28+阅读 · 2022年9月11日

《利用多模态移动传感器数据对健康进行建模的机器学习》剑桥大学博士论文

《利用多模态移动传感器数据对健康进行建模的机器学习》剑桥大学博士论文

专知

16+阅读 · 2022年5月3日

MIT最新博士论文《用于个性化医疗和保险的新型机器学习算法》，350页pdf

MIT最新博士论文《用于个性化医疗和保险的新型机器学习算法》，350页pdf

专知

10+阅读 · 2022年5月2日

2022最新《数据与机器学习，人工智能报告》

2022最新《数据与机器学习，人工智能报告》

专知

10+阅读 · 2022年2月21日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知

26+阅读 · 2020年7月26日

清华大学《高级机器学习》课程

清华大学《高级机器学习》课程

专知

40+阅读 · 2020年7月21日

孟小峰：机器学习与数据库技术融合

孟小峰：机器学习与数据库技术融合

计算机研究与发展

14+阅读 · 2018年9月6日

支持智能终端通信的物联网管控机制研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

面向智能电网多元储能系统的信息综合利用及自学习研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向事件检测的感知数据处理方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

富信息环境下复杂可修系统动态维修决策研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向大数据的信息可视化设计方法研究

国家自然科学基金

6+阅读 · 2014年12月31日

大数据背景下的商业模式创新机制研究

国家自然科学基金

5+阅读 · 2014年12月31日

面向大规模知识图谱的查询处理关键技术研究

国家自然科学基金

18+阅读 · 2014年12月31日

癌症基因组中关键驱动突变信号通路的理论问题研究及算法设计

国家自然科学基金

0+阅读 · 2014年12月31日

面向三维服装建模的形状分析与处理方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

215+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

81+阅读 · 2023年4月4日

Choose Your Weapon: Survival Strategies for Depressed AI Academics

Arxiv

31+阅读 · 2023年3月31日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

473+阅读 · 2023年3月31日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

Knowledge Graphs: Opportunities and Challenges

Arxiv

172+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

84+阅读 · 2023年3月21日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

VIP会员

相关主题

机器人和自主系统

相关VIP内容

《协作机器人的学习行为树》最新146页博士论文

《协作机器人的学习行为树》最新146页博士论文

专知会员服务

45+阅读 · 2024年2月7日

《利用深度多模态结构实现机器人可靠感知和定位》366页博士论文

《利用深度多模态结构实现机器人可靠感知和定位》366页博士论文

专知会员服务

43+阅读 · 2024年1月29日

【博士论文】结构化数据自动可视化关键技术研究

【博士论文】结构化数据自动可视化关键技术研究

专知会员服务

47+阅读 · 2023年12月6日

《利用边缘计算为物联网系统提供分布式智能》2023最新博士论文

《利用边缘计算为物联网系统提供分布式智能》2023最新博士论文

专知会员服务

48+阅读 · 2023年10月30日

《可解释深度学习视角》2023最新博士论文

《可解释深度学习视角》2023最新博士论文

专知会员服务

48+阅读 · 2023年9月5日

《人机协作决策优化》142页博士论文

《人机协作决策优化》142页博士论文

专知会员服务

176+阅读 · 2023年7月16日

博士论文 |《多智能体系统：协作辅助智能体和对对抗性攻击的鲁棒性》哈佛大学

博士论文 |《多智能体系统：协作辅助智能体和对对抗性攻击的鲁棒性》哈佛大学

专知会员服务

66+阅读 · 2023年2月27日

《基于形式化方法的多机器人系统规划与规范》2022博士论文

《基于形式化方法的多机器人系统规划与规范》2022博士论文

专知会员服务

41+阅读 · 2022年11月22日

《陆地机器人技术：军事和国防领域认知系统的集成》2022最新34页论文

《陆地机器人技术：军事和国防领域认知系统的集成》2022最新34页论文

专知会员服务

64+阅读 · 2022年11月21日

《利用多模态移动传感器数据对健康进行建模的机器学习》剑桥大学博士论文

《利用多模态移动传感器数据对健康进行建模的机器学习》剑桥大学博士论文

专知会员服务

76+阅读 · 2022年4月30日

热门VIP内容

开通专知VIP会员享更多权益服务

《人工智能绝不能完全自主》

《人工智能的法律与伦理：军事自主机器独特挑战的深度剖析》316页

从数据到主导：AI与兵棋推演构筑决策优势

《特洛伊木马货柜：武器化集装箱的战略威胁》最新报告

相关资讯

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

专知

27+阅读 · 2022年11月23日

《使用机器学习智能体设计基于模拟的空战飞行员训练系统》2022瑞典林雪平大学页论文

《使用机器学习智能体设计基于模拟的空战飞行员训练系统》2022瑞典林雪平大学页论文

专知

37+阅读 · 2022年10月30日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

32+阅读 · 2022年10月17日

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

专知

28+阅读 · 2022年9月11日

《利用多模态移动传感器数据对健康进行建模的机器学习》剑桥大学博士论文

《利用多模态移动传感器数据对健康进行建模的机器学习》剑桥大学博士论文

专知

16+阅读 · 2022年5月3日

MIT最新博士论文《用于个性化医疗和保险的新型机器学习算法》，350页pdf

MIT最新博士论文《用于个性化医疗和保险的新型机器学习算法》，350页pdf

专知

10+阅读 · 2022年5月2日

2022最新《数据与机器学习，人工智能报告》

2022最新《数据与机器学习，人工智能报告》

专知

10+阅读 · 2022年2月21日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知

26+阅读 · 2020年7月26日

清华大学《高级机器学习》课程

清华大学《高级机器学习》课程

专知

40+阅读 · 2020年7月21日

孟小峰：机器学习与数据库技术融合

孟小峰：机器学习与数据库技术融合

计算机研究与发展

14+阅读 · 2018年9月6日

相关基金

支持智能终端通信的物联网管控机制研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

面向智能电网多元储能系统的信息综合利用及自学习研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向事件检测的感知数据处理方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

富信息环境下复杂可修系统动态维修决策研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向大数据的信息可视化设计方法研究

国家自然科学基金

6+阅读 · 2014年12月31日

大数据背景下的商业模式创新机制研究

国家自然科学基金

5+阅读 · 2014年12月31日

面向大规模知识图谱的查询处理关键技术研究

国家自然科学基金

18+阅读 · 2014年12月31日

癌症基因组中关键驱动突变信号通路的理论问题研究及算法设计

国家自然科学基金

0+阅读 · 2014年12月31日

面向三维服装建模的形状分析与处理方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

215+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

81+阅读 · 2023年4月4日

Choose Your Weapon: Survival Strategies for Depressed AI Academics

Arxiv

31+阅读 · 2023年3月31日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

473+阅读 · 2023年3月31日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

Knowledge Graphs: Opportunities and Challenges

Arxiv

172+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

84+阅读 · 2023年3月21日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员