【AAAI2025教程】基础模型与具身智能体的交汇，350页ppt - 专知VIP

会员服务 ·

24

基础模型 · 具身智能 · 智能体 · 视觉语言模型 ·

【AAAI2025教程】基础模型与具身智能体的交汇，350页ppt

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

基础模型与具身智能体的交汇具身智能体是一种通用型智能体，能够接收人类的自然语言指令，并在多样化的环境中执行广泛的任务。近年来，大型语言模型（Large Language Models, LLMs）作为构建大型智能体模型（Large Agent Models）的强大工具崭露头角，在支持具身智能体实现目标解析、子目标分解、动作序列化以及状态转换建模（从前提到后效的因果转换）等能力方面取得了显著成功。然而，从基础模型（Foundation Models）到具身智能体的发展过程中，理解低层次视觉细节以及实现长时程推理以支持可靠的具身决策，仍然面临重大挑战。本文将涵盖基础模型向大型语言模型、视觉-语言模型（Vision-Language Models）以及视觉-语言-动作模型（Vision-Language-Action Models）的演进。在本教程中，我们将全面回顾现有具身智能体基础模型的范式，并基于机器人学习的基本数学框架——马尔可夫决策过程（Markov Decision Process, MDP），聚焦其不同的形式化方法，同时提供一个结构化视角来研究机器人的决策过程。

成为VIP会员查看完整内容

49

相关内容

基础模型

【AAAI2024教程】在规划中大型语言模型的作用，181页ppt

【AAAI2024教程】在规划中大型语言模型的作用，181页ppt

专知会员服务

78+阅读 · 2024年2月22日

【CIKM2023教程】会话人工智能的数据增强，170页ppt

【CIKM2023教程】会话人工智能的数据增强，170页ppt

专知会员服务

45+阅读 · 2023年11月11日

【干货书】基于智能体的演化博弈动力学，207页pdf

【干货书】基于智能体的演化博弈动力学，207页pdf

专知会员服务

104+阅读 · 2023年4月3日

【AAAI2023教程】持续学习，终身学习，不停止学习，197页ppt

【AAAI2023教程】持续学习，终身学习，不停止学习，197页ppt

专知会员服务

66+阅读 · 2023年2月12日

多模态学习有哪些架构？MBZUAI最新《多模态表示学习》综述，29页:演化、预训练及其应用综述

多模态学习有哪些架构？MBZUAI最新《多模态表示学习》综述，29页:演化、预训练及其应用综述

专知会员服务

67+阅读 · 2023年2月5日

【LREC2022教程】自然语言处理统一意义表示学习，113页ppt

【LREC2022教程】自然语言处理统一意义表示学习，113页ppt

专知会员服务

26+阅读 · 2022年6月10日

图注意力网络，14页pdf

图注意力网络，14页pdf

专知会员服务

62+阅读 · 2022年6月6日

【ICCV2021教程】基于能量生成模型的理论与应用，193页ppt

专知会员服务

31+阅读 · 2021年10月17日

【IJCAI2021-Tutorial】机器阅读理解: 预训练语言模型，99页ppt

专知会员服务

39+阅读 · 2021年8月22日

【XAI研讨会】知识图谱中的可解释可验证表示学习，62页ppt

【XAI研讨会】知识图谱中的可解释可验证表示学习，62页ppt

专知会员服务

134+阅读 · 2019年12月7日

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

专知

60+阅读 · 2023年4月5日

【2022新书】深度强化学习基础: Python的理论与实践, 413页pdf

【2022新书】深度强化学习基础: Python的理论与实践, 413页pdf

专知

17+阅读 · 2022年11月18日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

29+阅读 · 2022年9月19日

【2022新书】数据科学的实用线性代数，328页pdf

【2022新书】数据科学的实用线性代数，328页pdf

专知

22+阅读 · 2022年9月18日

【经典书】图数据挖掘算法，安全性及应用，256页pdf

【经典书】图数据挖掘算法，安全性及应用，256页pdf

专知

17+阅读 · 2022年8月22日

【2022新书】机器学习中的概率数值计算，412页pdf

【2022新书】机器学习中的概率数值计算，412页pdf

专知

32+阅读 · 2022年7月7日

【干货书】《Transformers 机器学习:深度探究》，284页pdf

【干货书】《Transformers 机器学习:深度探究》，284页pdf

专知

70+阅读 · 2022年4月21日

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

专知

16+阅读 · 2020年12月9日

Transformer模型-深度学习自然语言处理，17页ppt

Transformer模型-深度学习自然语言处理，17页ppt

专知

13+阅读 · 2020年8月30日

【KDD2020】图神经网络:基础与应用，322页ppt

【KDD2020】图神经网络:基础与应用，322页ppt

专知

35+阅读 · 2020年8月29日

语义Web知识库补全关键技术研究

国家自然科学基金

17+阅读 · 2017年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

46+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

29+阅读 · 2015年12月31日

基于决策模型和预备电位的运动想象BCI研究

国家自然科学基金

3+阅读 · 2015年12月31日

CGF战场空间认知行为建模研究

国家自然科学基金

51+阅读 · 2014年12月31日

数据驱动的人体图像语义分割研究

国家自然科学基金

4+阅读 · 2014年12月31日

Biot模型基于有限元离散的多重网格算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

关于面板(纵向）数据的动态统计分析

国家自然科学基金

0+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

基于UGC的应急响应决策支持系统关键技术研究

国家自然科学基金

13+阅读 · 2014年12月31日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

106+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

223+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

A survey and taxonomy of loss functions in machine learning

Arxiv

27+阅读 · 2023年1月13日

Geometric multimodal representation learning

Arxiv

69+阅读 · 2022年9月7日

MLRIP: Pre-training a military language representation model with informative factual knowledge and professional knowledge base

Arxiv

36+阅读 · 2022年7月28日

Deep learning: a statistical viewpoint

Arxiv

18+阅读 · 2021年3月16日

Meta-learning in natural and artificial intelligence

Arxiv

10+阅读 · 2020年11月26日

Tensor Decompositions for temporal knowledge base completion

Arxiv

10+阅读 · 2020年4月10日

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Arxiv

17+阅读 · 2019年11月6日

VIP会员

相关主题

视觉语言模型

相关VIP内容

【AAAI2024教程】在规划中大型语言模型的作用，181页ppt

【AAAI2024教程】在规划中大型语言模型的作用，181页ppt

专知会员服务

78+阅读 · 2024年2月22日

【CIKM2023教程】会话人工智能的数据增强，170页ppt

【CIKM2023教程】会话人工智能的数据增强，170页ppt

专知会员服务

45+阅读 · 2023年11月11日

【干货书】基于智能体的演化博弈动力学，207页pdf

【干货书】基于智能体的演化博弈动力学，207页pdf

专知会员服务

104+阅读 · 2023年4月3日

【AAAI2023教程】持续学习，终身学习，不停止学习，197页ppt

【AAAI2023教程】持续学习，终身学习，不停止学习，197页ppt

专知会员服务

66+阅读 · 2023年2月12日

多模态学习有哪些架构？MBZUAI最新《多模态表示学习》综述，29页:演化、预训练及其应用综述

多模态学习有哪些架构？MBZUAI最新《多模态表示学习》综述，29页:演化、预训练及其应用综述

专知会员服务

67+阅读 · 2023年2月5日

【LREC2022教程】自然语言处理统一意义表示学习，113页ppt

【LREC2022教程】自然语言处理统一意义表示学习，113页ppt

专知会员服务

26+阅读 · 2022年6月10日

图注意力网络，14页pdf

图注意力网络，14页pdf

专知会员服务

62+阅读 · 2022年6月6日

【ICCV2021教程】基于能量生成模型的理论与应用，193页ppt

专知会员服务

31+阅读 · 2021年10月17日

【IJCAI2021-Tutorial】机器阅读理解: 预训练语言模型，99页ppt

专知会员服务

39+阅读 · 2021年8月22日

【XAI研讨会】知识图谱中的可解释可验证表示学习，62页ppt

【XAI研讨会】知识图谱中的可解释可验证表示学习，62页ppt

专知会员服务

134+阅读 · 2019年12月7日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】多目标奖励与偏好优化：理论与算法

《无形的防御者？将定向能武器集成到反无人机框架的机遇与挑战》报告

自主化海军：海上无人系统与未来海战

迈向智能体系统规模化的科学

相关资讯

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

专知

60+阅读 · 2023年4月5日

【2022新书】深度强化学习基础: Python的理论与实践, 413页pdf

【2022新书】深度强化学习基础: Python的理论与实践, 413页pdf

专知

17+阅读 · 2022年11月18日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

29+阅读 · 2022年9月19日

【2022新书】数据科学的实用线性代数，328页pdf

【2022新书】数据科学的实用线性代数，328页pdf

专知

22+阅读 · 2022年9月18日

【经典书】图数据挖掘算法，安全性及应用，256页pdf

【经典书】图数据挖掘算法，安全性及应用，256页pdf

专知

17+阅读 · 2022年8月22日

【2022新书】机器学习中的概率数值计算，412页pdf

【2022新书】机器学习中的概率数值计算，412页pdf

专知

32+阅读 · 2022年7月7日

【干货书】《Transformers 机器学习:深度探究》，284页pdf

【干货书】《Transformers 机器学习:深度探究》，284页pdf

专知

70+阅读 · 2022年4月21日

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

专知

16+阅读 · 2020年12月9日

Transformer模型-深度学习自然语言处理，17页ppt

Transformer模型-深度学习自然语言处理，17页ppt

专知

13+阅读 · 2020年8月30日

【KDD2020】图神经网络:基础与应用，322页ppt

【KDD2020】图神经网络:基础与应用，322页ppt

专知

35+阅读 · 2020年8月29日

相关基金

语义Web知识库补全关键技术研究

国家自然科学基金

17+阅读 · 2017年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

46+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

29+阅读 · 2015年12月31日

基于决策模型和预备电位的运动想象BCI研究

国家自然科学基金

3+阅读 · 2015年12月31日

CGF战场空间认知行为建模研究

国家自然科学基金

51+阅读 · 2014年12月31日

数据驱动的人体图像语义分割研究

国家自然科学基金

4+阅读 · 2014年12月31日

Biot模型基于有限元离散的多重网格算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

关于面板(纵向）数据的动态统计分析

国家自然科学基金

0+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

基于UGC的应急响应决策支持系统关键技术研究

国家自然科学基金

13+阅读 · 2014年12月31日

相关论文

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

106+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

223+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

A survey and taxonomy of loss functions in machine learning

Arxiv

27+阅读 · 2023年1月13日

Geometric multimodal representation learning

Arxiv

69+阅读 · 2022年9月7日

MLRIP: Pre-training a military language representation model with informative factual knowledge and professional knowledge base

Arxiv

36+阅读 · 2022年7月28日

Deep learning: a statistical viewpoint

Arxiv

18+阅读 · 2021年3月16日

Meta-learning in natural and artificial intelligence

Arxiv

10+阅读 · 2020年11月26日

Tensor Decompositions for temporal knowledge base completion

Arxiv

10+阅读 · 2020年4月10日

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Arxiv

17+阅读 · 2019年11月6日

微信扫码咨询专知VIP会员