世界模型通过数据驱动的方式学习环境的动态,利用成本效益高的模拟和可微性,在控制、设计、识别和生成等下游任务中提高性能和效率。理想情况下,预训练的世界模型应当满足以下条件:(1)准确模拟真实动态,(2)能轻松适应新的配置,(3)能够在不同的物理效应下进行泛化。此前的尝试要么采用了具有少量可微物理参数的基于模型的物理学,要么仅为特定场景进行训练,集成的物理先验非常有限。这些世界模型未能实现其目标,限制了它们在现实世界中的准确评估应用以及扩展到更大的预训练世界模型的能力。在本论文中,我们旨在通过神经物理学构建世界模型,神经物理学是一个混合神经-物理框架,利用可微物理学建模基本动态,同时通过神经网络学习所有其他模块。通过集成神经物理学,世界模型能够紧密遵循物理原理,同时高效地学习多种效应。神经物理学的模块化结构使得世界模型能够通过简单地安装不同的预训练神经模块来适应新的配置。我们将展示这一新型框架在重建、机器人控制和科学发现等应用中的有效性。

1.1 动机

科学家们长期以来一直在研究有效的方法,以开发世界的高效表示,称为世界模型[51, 95]。世界模型使得智能体能够与环境进行交互,既可以预测未来事件[54, 57, 58, 80, 209, 211],也可以基于当前状态或动作推导梯度[35, 37, 66, 67, 140, 142, 141, 191]。通常,世界模型具有感知来自环境的多模态信号的能力,并通过多模态反馈响应输入的控制信号[51, 80, 113]。具有成本效益的未来轨迹和导数的可用性显著提高了数据效率、鲁棒性以及下游任务的性能,包括机器人控制和设计[57, 58, 113, 114]、推理[51]和生成[192]。 近期的研究已经开发了基于物理的世界模型,使用可微物理模拟器或残差物理来建模诸如刚性体[141, 199]、可变形体[140, 142, 37, 191]、流体[35, 196]以及多物理系统[101]等已研究的物理效应。这些世界模型通常通过优化预定义的系统参数与现实世界的物理对齐良好,从而使它们能够有效地推广到未见过的配置。然而,依赖手动设计的物理引擎和系统参数限制了它们对未建模物理效应的普遍性。例如,使用基于专用有限元方法构建的可微变形体仿真来模拟流体环境需要大量的工作,甚至可能是不可能的。这一局限性凸显了将这些模型扩展到多样和复杂物理现象时所面临的挑战。 另一方面,另一个研究方向试图使用图神经网络[154, 137]或潜在动态模型[53, 54],在最小物理先验的基础上建模世界。这些方法旨在建立基础的世界表示,而不依赖过多的预定义物理参数,而是利用结构和学习到的表示来理解和预测动态。这可以导致更灵活的模型,而不受手动设计的物理限制。然而,由于缺乏基本的物理原理,这可能导致样本效率降低、计算浪费以及物理完整性的妥协。 近期的研究还探讨了通过使用物理信息神经网络(PINNs)[146, 144, 145, 81]将物理先验集成到普通神经网络中的方法。在这种方法中,物理约束被作为损失函数进行公式化,并以自监督的方式回传到神经网络中。PINNs通过将数据与物理定律相结合,提供了一种新的视角来建模物理世界。然而,它们的集成通常过于弱,无法可靠地支持长期的下游任务。此外,PINNs通常针对特定场景配置和时间跨度进行优化,限制了它们在更广泛场景中的应用。

成为VIP会员查看完整内容
27

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
【博士论文】迈向可扩展、灵活的点云场景流
专知会员服务
14+阅读 · 3月21日
【CMU博士论文】通过课程学习实现鲁棒的强化学习
专知会员服务
24+阅读 · 2024年12月15日
【CMU博士论文】用于机器人规划与控制的可微凸模型
专知会员服务
22+阅读 · 2024年12月7日
【MIT博士论文】物理启发的生成式模型
专知会员服务
31+阅读 · 2024年9月6日
【MIT博士论文】高效深度学习计算的模型加速
专知会员服务
29+阅读 · 2024年8月23日
【CMU博士论文】以人为中心的机器学习:统计和算法视角
专知会员服务
40+阅读 · 2023年10月1日
专知会员服务
31+阅读 · 2020年12月21日
论文浅尝 | 采用多层注意力机制的事件检测
开放知识图谱
24+阅读 · 2019年8月24日
【机器学习】深入剖析机器学习中的统计思想
产业智能官
16+阅读 · 2019年1月24日
【学界】基于条件深度卷积生成对抗网络的图像识别方法
GAN生成式对抗网络
16+阅读 · 2018年7月26日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
166+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
453+阅读 · 2023年3月31日
Arxiv
76+阅读 · 2023年3月26日
Arxiv
166+阅读 · 2023年3月24日
Arxiv
24+阅读 · 2023年3月17日
VIP会员
相关VIP内容
【博士论文】迈向可扩展、灵活的点云场景流
专知会员服务
14+阅读 · 3月21日
【CMU博士论文】通过课程学习实现鲁棒的强化学习
专知会员服务
24+阅读 · 2024年12月15日
【CMU博士论文】用于机器人规划与控制的可微凸模型
专知会员服务
22+阅读 · 2024年12月7日
【MIT博士论文】物理启发的生成式模型
专知会员服务
31+阅读 · 2024年9月6日
【MIT博士论文】高效深度学习计算的模型加速
专知会员服务
29+阅读 · 2024年8月23日
【CMU博士论文】以人为中心的机器学习:统计和算法视角
专知会员服务
40+阅读 · 2023年10月1日
专知会员服务
31+阅读 · 2020年12月21日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员