基于多模态大模型的具身智能体研究进展与展望 - 专知VIP

会员服务 ·

7

多模态大模型 · 具身智能 · 视觉语言模型 · 机器人 ·

基于多模态大模型的具身智能体研究进展与展望

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

**摘要：**具身智能体指能够根据指令完成某种或多种任务并且具备与物理环境交互能力的智能实体。其在服务机器人、智能教育、辅助医疗等领域具有巨大的潜在应用，是实现通用机器人的重要途径之一。随着多模态大模型的发展，具身智能体具备了更强的语言理解、推理判断和环境感知能力，极大地推动了该领域的发展。近年来，具身智能体领域涌现出许多优秀的研究工作，但缺乏系统的调查评述。为了帮助研究者更全面地了解这一领域，对具身智能体的研究进行了深入调研与展望。首先，介绍了多模态大模型，其次回顾了常用数据集和用于构建具身智能体的物理载体。然后，回顾了具身智能体的3个关键研究方向：具身大模型、高级任务规划和低级动作控制。最后，总结了具身智能体领域面临的挑战和存在的局限性，并展望了未来的发展方向。该综述为研究者提供了有价值的参考，旨在促进具身智能体领域的进一步发展与创新。 **关键词：**具身智能体，多模态大模型，机器人，视觉语言模型，具身智能

成为VIP会员查看完整内容

7

相关内容

多模态大模型

多模态大模型

生成式人工智能时代的多目标推荐：最新进展与未来展望综述

生成式人工智能时代的多目标推荐：最新进展与未来展望综述

专知会员服务

26+阅读 · 6月23日

AI大模型驱动的具身智能人形机器人技术与展望

AI大模型驱动的具身智能人形机器人技术与展望

专知会员服务

19+阅读 · 5月26日

物理引导的深度学习研究综述：进展、挑战和展望

物理引导的深度学习研究综述：进展、挑战和展望

专知会员服务

28+阅读 · 5月11日

数据驱动的具身学习探索

数据驱动的具身学习探索

专知会员服务

10+阅读 · 2月26日

生成式模型赋能飞行器技术应用研究进展与展望

生成式模型赋能飞行器技术应用研究进展与展望

专知会员服务

26+阅读 · 2024年12月29日

无人智能集群系统决策与控制研究进展

无人智能集群系统决策与控制研究进展

专知会员服务

47+阅读 · 2024年12月12日

大模型在军事领域的应用与展望

大模型在军事领域的应用与展望

专知会员服务

99+阅读 · 2024年12月5日

面向空战仿真的智能对手建模研究进展与展望

面向空战仿真的智能对手建模研究进展与展望

专知会员服务

39+阅读 · 2024年7月14日

基于人机智能融合技术的态势感知应用研究

基于人机智能融合技术的态势感知应用研究

专知会员服务

92+阅读 · 2024年2月11日

强化学习的自动驾驶控制技术研究进展

专知会员服务

138+阅读 · 2021年2月17日

【综述】多智能体强化学习算法理论研究

【综述】多智能体强化学习算法理论研究

深度强化学习实验室

15+阅读 · 2020年9月9日

【长文综述】基于图神经网络的知识图谱研究进展

【长文综述】基于图神经网络的知识图谱研究进展

深度学习自然语言处理

15+阅读 · 2020年8月23日

语音信号处理：从基本算法到前沿的深度学习方法

语音信号处理：从基本算法到前沿的深度学习方法

PaperWeekly

15+阅读 · 2020年3月26日

人工智能应用实践与趋势

人工智能应用实践与趋势

人工智能学家

13+阅读 · 2019年9月20日

新能源汽车关键技术在国防领域的应用展望

新能源汽车关键技术在国防领域的应用展望

未来产业促进会

10+阅读 · 2019年5月28日

综述 | CVPR2019目标检测方法进展

综述 | CVPR2019目标检测方法进展

计算机视觉life

15+阅读 · 2019年4月3日

人工智能在教育领域的应用探析

人工智能在教育领域的应用探析

MOOC

13+阅读 · 2019年3月16日

【30页综述和代码实现】基于深度学习的生物信息学应用及展望

【30页综述和代码实现】基于深度学习的生物信息学应用及展望

专知

39+阅读 · 2019年3月5日

机器学习优化方法综述论文【附65页论文下载】

机器学习优化方法综述论文【附65页论文下载】

专知

34+阅读 · 2019年1月19日

贝叶斯机器学习前沿进展

贝叶斯机器学习前沿进展

架构文摘

13+阅读 · 2018年2月11日

基于多芯光纤的高精度三维姿态测量关键技术研究

国家自然科学基金

0+阅读 · 2017年12月31日

非结构环境下基于三维肢体动作理解的工业机器人交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

人体行为识别的时空耦合随机图模型及其高效推理算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于三维超声的肝脏微创治疗智能导航系统关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于模块结合面微观接触机理的模块化机器人动态特性分析与研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向聋儿言语康复的多模态人机交互模型及技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于波前动态扫描系统的计算全息三维显示技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于超云平台的社会化移动网络大数据管理与分析关键技术研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于组态地理实体符号的传感器实时监控关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向大数据的信息可视化设计方法研究

国家自然科学基金

6+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

170+阅读 · 2023年4月20日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

81+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

470+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

145+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

77+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

170+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

84+阅读 · 2023年3月21日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

VIP会员

相关主题

多模态大模型

视觉语言模型

相关VIP内容

生成式人工智能时代的多目标推荐：最新进展与未来展望综述

生成式人工智能时代的多目标推荐：最新进展与未来展望综述

专知会员服务

26+阅读 · 6月23日

AI大模型驱动的具身智能人形机器人技术与展望

AI大模型驱动的具身智能人形机器人技术与展望

专知会员服务

19+阅读 · 5月26日

物理引导的深度学习研究综述：进展、挑战和展望

物理引导的深度学习研究综述：进展、挑战和展望

专知会员服务

28+阅读 · 5月11日

数据驱动的具身学习探索

数据驱动的具身学习探索

专知会员服务

10+阅读 · 2月26日

生成式模型赋能飞行器技术应用研究进展与展望

生成式模型赋能飞行器技术应用研究进展与展望

专知会员服务

26+阅读 · 2024年12月29日

无人智能集群系统决策与控制研究进展

无人智能集群系统决策与控制研究进展

专知会员服务

47+阅读 · 2024年12月12日

大模型在军事领域的应用与展望

大模型在军事领域的应用与展望

专知会员服务

99+阅读 · 2024年12月5日

面向空战仿真的智能对手建模研究进展与展望

面向空战仿真的智能对手建模研究进展与展望

专知会员服务

39+阅读 · 2024年7月14日

基于人机智能融合技术的态势感知应用研究

基于人机智能融合技术的态势感知应用研究

专知会员服务

92+阅读 · 2024年2月11日

强化学习的自动驾驶控制技术研究进展

专知会员服务

138+阅读 · 2021年2月17日

热门VIP内容

开通专知VIP会员享更多权益服务

美陆军研究报告《基于熵引导的深度神经网络加速收敛与性能提升方法》最新26页

基于多模态大模型的具身智能体研究进展与展望

中文版9300字 | 《未来战场图景：智能无人技术驱动陆战领域》

《英国空军从一战至二战期间航空技术、战术与战略的演变研究》2025最新210页

相关资讯

【综述】多智能体强化学习算法理论研究

【综述】多智能体强化学习算法理论研究

深度强化学习实验室

15+阅读 · 2020年9月9日

【长文综述】基于图神经网络的知识图谱研究进展

【长文综述】基于图神经网络的知识图谱研究进展

深度学习自然语言处理

15+阅读 · 2020年8月23日

语音信号处理：从基本算法到前沿的深度学习方法

语音信号处理：从基本算法到前沿的深度学习方法

PaperWeekly

15+阅读 · 2020年3月26日

人工智能应用实践与趋势

人工智能应用实践与趋势

人工智能学家

13+阅读 · 2019年9月20日

新能源汽车关键技术在国防领域的应用展望

新能源汽车关键技术在国防领域的应用展望

未来产业促进会

10+阅读 · 2019年5月28日

综述 | CVPR2019目标检测方法进展

综述 | CVPR2019目标检测方法进展

计算机视觉life

15+阅读 · 2019年4月3日

人工智能在教育领域的应用探析

人工智能在教育领域的应用探析

MOOC

13+阅读 · 2019年3月16日

【30页综述和代码实现】基于深度学习的生物信息学应用及展望

【30页综述和代码实现】基于深度学习的生物信息学应用及展望

专知

39+阅读 · 2019年3月5日

机器学习优化方法综述论文【附65页论文下载】

机器学习优化方法综述论文【附65页论文下载】

专知

34+阅读 · 2019年1月19日

贝叶斯机器学习前沿进展

贝叶斯机器学习前沿进展

架构文摘

13+阅读 · 2018年2月11日

相关基金

基于多芯光纤的高精度三维姿态测量关键技术研究

国家自然科学基金

0+阅读 · 2017年12月31日

非结构环境下基于三维肢体动作理解的工业机器人交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

人体行为识别的时空耦合随机图模型及其高效推理算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于三维超声的肝脏微创治疗智能导航系统关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于模块结合面微观接触机理的模块化机器人动态特性分析与研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向聋儿言语康复的多模态人机交互模型及技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于波前动态扫描系统的计算全息三维显示技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于超云平台的社会化移动网络大数据管理与分析关键技术研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于组态地理实体符号的传感器实时监控关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向大数据的信息可视化设计方法研究

国家自然科学基金

6+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

170+阅读 · 2023年4月20日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

81+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

470+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

145+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

77+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

170+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

84+阅读 · 2023年3月21日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员