基础模型与具身智能体的交汇具身智能体是一种通用型智能体,能够接收人类的自然语言指令,并在多样化的环境中执行广泛的任务。近年来,大型语言模型(Large Language Models, LLMs)作为构建大型智能体模型(Large Agent Models)的强大工具崭露头角,在支持具身智能体实现目标解析、子目标分解、动作序列化以及状态转换建模(从前提到后效的因果转换)等能力方面取得了显著成功。然而,从基础模型(Foundation Models)到具身智能体的发展过程中,理解低层次视觉细节以及实现长时程推理以支持可靠的具身决策,仍然面临重大挑战。本文将涵盖基础模型向大型语言模型、视觉-语言模型(Vision-Language Models)以及视觉-语言-动作模型(Vision-Language-Action Models)的演进。在本教程中,我们将全面回顾现有具身智能体基础模型的范式,并基于机器人学习的基本数学框架——马尔可夫决策过程(Markov Decision Process, MDP),聚焦其不同的形式化方法,同时提供一个结构化视角来研究机器人的决策过程。

成为VIP会员查看完整内容
3

相关内容

【AAAI2024教程】在规划中大型语言模型的作用,181页ppt
专知会员服务
76+阅读 · 2024年2月22日
【CIKM2023教程】会话人工智能的数据增强,170页ppt
专知会员服务
45+阅读 · 2023年11月11日
【干货书】基于智能体的演化博弈动力学,207页pdf
专知会员服务
101+阅读 · 2023年4月3日
【LREC2022教程】自然语言处理统一意义表示学习,113页ppt
图注意力网络,14页pdf
专知会员服务
62+阅读 · 2022年6月6日
专知会员服务
30+阅读 · 2021年10月17日
【KDD2020】图神经网络:基础与应用,322页ppt
国家自然科学基金
13+阅读 · 2017年12月31日
国家自然科学基金
42+阅读 · 2015年12月31日
国家自然科学基金
28+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
45+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
A Survey of Large Language Models
Arxiv
442+阅读 · 2023年3月31日
Arxiv
68+阅读 · 2022年9月7日
Arxiv
18+阅读 · 2021年3月16日
Arxiv
10+阅读 · 2020年11月26日
VIP会员
相关VIP内容
【AAAI2024教程】在规划中大型语言模型的作用,181页ppt
专知会员服务
76+阅读 · 2024年2月22日
【CIKM2023教程】会话人工智能的数据增强,170页ppt
专知会员服务
45+阅读 · 2023年11月11日
【干货书】基于智能体的演化博弈动力学,207页pdf
专知会员服务
101+阅读 · 2023年4月3日
【LREC2022教程】自然语言处理统一意义表示学习,113页ppt
图注意力网络,14页pdf
专知会员服务
62+阅读 · 2022年6月6日
专知会员服务
30+阅读 · 2021年10月17日
相关基金
国家自然科学基金
13+阅读 · 2017年12月31日
国家自然科学基金
42+阅读 · 2015年12月31日
国家自然科学基金
28+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
45+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员