【斯坦福博士论文】构建类人化具身智能体：从人类行为中学习 - 专知VIP

会员服务 ·

5

具身智能 · 机器人 · 虚拟现实（VR） ·

【斯坦福博士论文】构建类人化具身智能体：从人类行为中学习

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

研究背景构建类人化具身智能体是机器人、虚拟现实和沉浸式技术领域的重要目标。尽管并非所有AI系统都需要模仿人类，但具有类人特征的智能体在远程呈现、辅助机器人和沉浸式游戏等特定应用中具有显著优势。类人外观增强了虚拟环境中的社交存在感和参与度，类人运动使机器人能够直接从人类演示中学习并在为人类设计的空间中使用人类工具高效操作，而类人推理则提高了可解释性和决策能力。然而，实现这些能力面临着重大的技术挑战。研究内容与方法本论文从外观、运动和推理三个关键方向探索类人化具身智能体的构建：类人外观：研究重点在于创建数字环境中与人类相似的具身智能体。提出了一种基于逆向物理和逆向渲染的新框架，从视频数据中重建逼真、可动画化的数字人类。该方法通过基于物理的模拟器和渲染器，保留了细粒度的视觉细节，同时捕捉衣物的物理动态，实现了逼真的服装运动和对新动作的鲁棒泛化。类人运动：研究提出了HumanPlus系统，通过"影子学习"将人类运动迁移到人形机器人上，使机器人能够直接从人类演示中学习复杂技能。通过这种方式收集的演示数据进一步促进了自主技能的现实世界模仿学习。类人推理：研究探索了通过基础模型和思维链推理开发更通用策略的方法，以模拟类人推理并提升性能。提出将中间视觉预测作为视觉-语言-动作模型中的"视觉思维链"，使智能体在多样化任务中实现更高性能。研究贡献本论文的主要贡献包括：提出了一种基于逆向物理和逆向渲染的数字人类重建框架，实现了逼真的外观和动态衣物模拟。开发了HumanPlus系统，通过影子学习实现人类运动到机器人的高效迁移，推动了机器人技能学习的实际应用。引入了视觉思维链的概念，通过中间视觉预测提升了智能体在复杂任务中的推理能力和性能。

成为VIP会员查看完整内容

8

相关内容

具身智能

具身智能是指一种基于物理身体进行感知和行动的智能系统，其通过智能体与环境的交互获取信息、理解问题、做出决策并实现行动，从而产生智能行为和适应性。

【CMU博士论文】个性化情境感知多模态机器人反馈

【CMU博士论文】个性化情境感知多模态机器人反馈

专知会员服务

15+阅读 · 3月4日

【斯坦福博士论文】通过深度状态空间方法推进序列建模

【斯坦福博士论文】通过深度状态空间方法推进序列建模

专知会员服务

26+阅读 · 1月5日

【新书】深度强化学习在可重构智能表面和无人机赋能智能6G通信中的应用

【新书】深度强化学习在可重构智能表面和无人机赋能智能6G通信中的应用

专知会员服务

22+阅读 · 1月3日

【伯克利博士论文】通过视频生成学习关于世界的知识

【伯克利博士论文】通过视频生成学习关于世界的知识

专知会员服务

29+阅读 · 2024年12月19日

【牛津大学博士论文】改进单智能体和多智能体深度强化学习方法

【牛津大学博士论文】改进单智能体和多智能体深度强化学习方法

专知会员服务

46+阅读 · 2024年10月22日

【伯克利博士论文】通过强化学习实现安全且可信的决策制定

【伯克利博士论文】通过强化学习实现安全且可信的决策制定

专知会员服务

30+阅读 · 2024年10月10日

【CMU博士论文】机器人学习中的触觉感知：从开发到部署

【CMU博士论文】机器人学习中的触觉感知：从开发到部署

专知会员服务

23+阅读 · 2024年9月9日

【伯克利博士论文】大型语言模型:迈向能够学习和发现一切的机器

【伯克利博士论文】大型语言模型:迈向能够学习和发现一切的机器

专知会员服务

42+阅读 · 2024年9月8日

【剑桥大学博士论文】深度学习中的元学习、鲁棒性和二阶优化进展

【剑桥大学博士论文】深度学习中的元学习、鲁棒性和二阶优化进展

专知会员服务

41+阅读 · 2024年5月5日

【斯坦福博士论文】利用离线数据构建多功能强化学习智能体

【斯坦福博士论文】利用离线数据构建多功能强化学习智能体

专知会员服务

48+阅读 · 2022年9月14日

论文盘点：人脸表情识别解析

论文盘点：人脸表情识别解析

PaperWeekly

13+阅读 · 2020年7月26日

【华为诺亚新论文】基于图上下文知识融入的预训练语言模型

【华为诺亚新论文】基于图上下文知识融入的预训练语言模型

专知

23+阅读 · 2019年12月8日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

76+阅读 · 2019年10月20日

专访俞栋：多模态是迈向通用人工智能的重要方向

专访俞栋：多模态是迈向通用人工智能的重要方向

AI科技评论

24+阅读 · 2019年9月9日

【泡泡读者来搞】ROS、Simulink、Carsim的互联与规划、控制算法的验证

【泡泡读者来搞】ROS、Simulink、Carsim的互联与规划、控制算法的验证

泡泡机器人SLAM

14+阅读 · 2019年5月1日

医疗机器学习综述，谷歌Jeff Dean等最新论文【附12页论文下载】

医疗机器学习综述，谷歌Jeff Dean等最新论文【附12页论文下载】

专知

15+阅读 · 2019年4月6日

【UC伯克利】可解释性机器学习：定义、方法和应用

【UC伯克利】可解释性机器学习：定义、方法和应用

专知

70+阅读 · 2019年1月19日

【混合智能】人机混合智能的哲学思考

【混合智能】人机混合智能的哲学思考

产业智能官

12+阅读 · 2018年10月28日

【AAAI专题】论文分享：以生物可塑性为核心的类脑脉冲神经网络

【AAAI专题】论文分享：以生物可塑性为核心的类脑脉冲神经网络

中国科学院自动化研究所

15+阅读 · 2018年1月23日

【人工智能】人工智能5大商业模式

【人工智能】人工智能5大商业模式

产业智能官

16+阅读 · 2017年10月16日

大数据环境下弱监督深度学习的人脸美丽预测研究

国家自然科学基金

3+阅读 · 2017年12月31日

中国资本市场的投资者信息解读：基于实验研究的心理学探索

国家自然科学基金

0+阅读 · 2015年12月31日

基于三维激光测距的移动机器人室外环境语义地图构建

国家自然科学基金

2+阅读 · 2015年12月31日

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

12+阅读 · 2015年12月31日

基于深度表达和迁移学习的人体检测研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于智能空间的云机器人行为知识驱动服务机制研究

国家自然科学基金

1+阅读 · 2015年12月31日

云计算下的加密域多媒体水印与模式匹配

国家自然科学基金

1+阅读 · 2015年12月31日

定位系统细胞启发的机器人情景认知地图构建与行为规划研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于多通道深度卷积神经网络的人体行为分析研究

国家自然科学基金

6+阅读 · 2015年12月31日

上市公司文本信息分析研究：基于大数据的视角

国家自然科学基金

8+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

165+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

37+阅读 · 2023年4月19日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

202+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

78+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

442+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

137+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

75+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

159+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

46+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

23+阅读 · 2023年3月17日

VIP会员

相关主题

虚拟现实（VR）

相关VIP内容

【CMU博士论文】个性化情境感知多模态机器人反馈

【CMU博士论文】个性化情境感知多模态机器人反馈

专知会员服务

15+阅读 · 3月4日

【斯坦福博士论文】通过深度状态空间方法推进序列建模

【斯坦福博士论文】通过深度状态空间方法推进序列建模

专知会员服务

26+阅读 · 1月5日

【新书】深度强化学习在可重构智能表面和无人机赋能智能6G通信中的应用

【新书】深度强化学习在可重构智能表面和无人机赋能智能6G通信中的应用

专知会员服务

22+阅读 · 1月3日

【伯克利博士论文】通过视频生成学习关于世界的知识

【伯克利博士论文】通过视频生成学习关于世界的知识

专知会员服务

29+阅读 · 2024年12月19日

【牛津大学博士论文】改进单智能体和多智能体深度强化学习方法

【牛津大学博士论文】改进单智能体和多智能体深度强化学习方法

专知会员服务

46+阅读 · 2024年10月22日

【伯克利博士论文】通过强化学习实现安全且可信的决策制定

【伯克利博士论文】通过强化学习实现安全且可信的决策制定

专知会员服务

30+阅读 · 2024年10月10日

【CMU博士论文】机器人学习中的触觉感知：从开发到部署

【CMU博士论文】机器人学习中的触觉感知：从开发到部署

专知会员服务

23+阅读 · 2024年9月9日

【伯克利博士论文】大型语言模型:迈向能够学习和发现一切的机器

【伯克利博士论文】大型语言模型:迈向能够学习和发现一切的机器

专知会员服务

42+阅读 · 2024年9月8日

【剑桥大学博士论文】深度学习中的元学习、鲁棒性和二阶优化进展

【剑桥大学博士论文】深度学习中的元学习、鲁棒性和二阶优化进展

专知会员服务

41+阅读 · 2024年5月5日

【斯坦福博士论文】利用离线数据构建多功能强化学习智能体

【斯坦福博士论文】利用离线数据构建多功能强化学习智能体

专知会员服务

48+阅读 · 2022年9月14日

热门VIP内容

开通专知VIP会员享更多权益服务

《B-2轰炸机在也门的空袭》

《组合优化问题强化学习框架在动态武器目标分配中的应用》61页

美国战略轰炸机（最新情况）

《核武器与人工智能：技术前景与现实挑战》

相关资讯

论文盘点：人脸表情识别解析

论文盘点：人脸表情识别解析

PaperWeekly

13+阅读 · 2020年7月26日

【华为诺亚新论文】基于图上下文知识融入的预训练语言模型

【华为诺亚新论文】基于图上下文知识融入的预训练语言模型

专知

23+阅读 · 2019年12月8日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

76+阅读 · 2019年10月20日

专访俞栋：多模态是迈向通用人工智能的重要方向

专访俞栋：多模态是迈向通用人工智能的重要方向

AI科技评论

24+阅读 · 2019年9月9日

【泡泡读者来搞】ROS、Simulink、Carsim的互联与规划、控制算法的验证

【泡泡读者来搞】ROS、Simulink、Carsim的互联与规划、控制算法的验证

泡泡机器人SLAM

14+阅读 · 2019年5月1日

医疗机器学习综述，谷歌Jeff Dean等最新论文【附12页论文下载】

医疗机器学习综述，谷歌Jeff Dean等最新论文【附12页论文下载】

专知

15+阅读 · 2019年4月6日

【UC伯克利】可解释性机器学习：定义、方法和应用

【UC伯克利】可解释性机器学习：定义、方法和应用

专知

70+阅读 · 2019年1月19日

【混合智能】人机混合智能的哲学思考

【混合智能】人机混合智能的哲学思考

产业智能官

12+阅读 · 2018年10月28日

【AAAI专题】论文分享：以生物可塑性为核心的类脑脉冲神经网络

【AAAI专题】论文分享：以生物可塑性为核心的类脑脉冲神经网络

中国科学院自动化研究所

15+阅读 · 2018年1月23日

【人工智能】人工智能5大商业模式

【人工智能】人工智能5大商业模式

产业智能官

16+阅读 · 2017年10月16日

相关基金

大数据环境下弱监督深度学习的人脸美丽预测研究

国家自然科学基金

3+阅读 · 2017年12月31日

中国资本市场的投资者信息解读：基于实验研究的心理学探索

国家自然科学基金

0+阅读 · 2015年12月31日

基于三维激光测距的移动机器人室外环境语义地图构建

国家自然科学基金

2+阅读 · 2015年12月31日

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

12+阅读 · 2015年12月31日

基于深度表达和迁移学习的人体检测研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于智能空间的云机器人行为知识驱动服务机制研究

国家自然科学基金

1+阅读 · 2015年12月31日

云计算下的加密域多媒体水印与模式匹配

国家自然科学基金

1+阅读 · 2015年12月31日

定位系统细胞启发的机器人情景认知地图构建与行为规划研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于多通道深度卷积神经网络的人体行为分析研究

国家自然科学基金

6+阅读 · 2015年12月31日

上市公司文本信息分析研究：基于大数据的视角

国家自然科学基金

8+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

165+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

37+阅读 · 2023年4月19日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

202+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

78+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

442+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

137+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

75+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

159+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

46+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

23+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员