研究背景构建类人化具身智能体是机器人、虚拟现实和沉浸式技术领域的重要目标。尽管并非所有AI系统都需要模仿人类,但具有类人特征的智能体在远程呈现、辅助机器人和沉浸式游戏等特定应用中具有显著优势。类人外观增强了虚拟环境中的社交存在感和参与度,类人运动使机器人能够直接从人类演示中学习并在为人类设计的空间中使用人类工具高效操作,而类人推理则提高了可解释性和决策能力。然而,实现这些能力面临着重大的技术挑战。研究内容与方法本论文从外观、运动和推理三个关键方向探索类人化具身智能体的构建:类人外观:研究重点在于创建数字环境中与人类相似的具身智能体。提出了一种基于逆向物理和逆向渲染的新框架,从视频数据中重建逼真、可动画化的数字人类。该方法通过基于物理的模拟器和渲染器,保留了细粒度的视觉细节,同时捕捉衣物的物理动态,实现了逼真的服装运动和对新动作的鲁棒泛化。类人运动:研究提出了HumanPlus系统,通过"影子学习"将人类运动迁移到人形机器人上,使机器人能够直接从人类演示中学习复杂技能。通过这种方式收集的演示数据进一步促进了自主技能的现实世界模仿学习。类人推理:研究探索了通过基础模型和思维链推理开发更通用策略的方法,以模拟类人推理并提升性能。提出将中间视觉预测作为视觉-语言-动作模型中的"视觉思维链",使智能体在多样化任务中实现更高性能。研究贡献本论文的主要贡献包括:提出了一种基于逆向物理和逆向渲染的数字人类重建框架,实现了逼真的外观和动态衣物模拟。开发了HumanPlus系统,通过影子学习实现人类运动到机器人的高效迁移,推动了机器人技能学习的实际应用。引入了视觉思维链的概念,通过中间视觉预测提升了智能体在复杂任务中的推理能力和性能。

成为VIP会员查看完整内容
8

相关内容

具身智能是指一种基于物理身体进行感知和行动的智能系统,其通过智能体与环境的交互获取信息、理解问题、做出决策并实现行动,从而产生智能行为和适应性。
【伯克利博士论文】通过视频生成学习关于世界的知识
专知会员服务
29+阅读 · 2024年12月19日
论文盘点:人脸表情识别解析
PaperWeekly
13+阅读 · 2020年7月26日
专访俞栋:多模态是迈向通用人工智能的重要方向
AI科技评论
24+阅读 · 2019年9月9日
【混合智能】人机混合智能的哲学思考
产业智能官
12+阅读 · 2018年10月28日
【AAAI专题】论文分享:以生物可塑性为核心的类脑脉冲神经网络
中国科学院自动化研究所
15+阅读 · 2018年1月23日
【人工智能】人工智能5大商业模式
产业智能官
16+阅读 · 2017年10月16日
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
Arxiv
165+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
442+阅读 · 2023年3月31日
Arxiv
75+阅读 · 2023年3月26日
Arxiv
159+阅读 · 2023年3月24日
Arxiv
23+阅读 · 2023年3月17日
VIP会员
相关资讯
相关基金
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员