“近日,上海交通大学人工智能研究院杨小康教授、王韫博助理教授指导的AI+Science研究团队的成果**《NeuroFluid: Fluid Dynamics Grounding with Particle-Driven Neural Radiance Fields》被国际顶级机器学习会议ICML 2022收录**。论文所提出的神经流体(NeuroFluid)模型,利用基于神经隐式场的人工智能可微渲染技术,将流体物理仿真看作求解流体场景三维渲染问题的逆问题——从流体场景的一段多视角表观图像中,即可反推出流体内部的运动规律。这项成果为计算流体动力学、多粒子动力学系统研究开辟了一种人工智能新途径。

  • 论文链接: arxiv.org/pdf/2203.01762.pdf
  • 代码地址: github.com/syguan96/NeuroFluid
  • 项目主页: syguan96.github.io/NeuroFluid/

图1. NeuroFluid从流体的视觉观测中反演其物理动态

流体运动研究是重要的自然科学基础研究领域,在航空航天、大气、海洋、航运、能源、建筑、环境等众多领域有着广泛应用。在传统研究方法中,求解流体运动(例如速度场)需要首先在理论上精确刻画流体的动力学模型,并结合微分方程、数值分析对模型求解。**但是通常对于复杂问题(例如湍流),人们很难用数学物理方程进行描述,复杂流体的Navier-Stokes方程是世界级千禧难题,至今依然没被很好解决。**现有基于深度学习的方法通常从拉格朗日视角描述流体,即流体被看作由许多粒子组成,通过测定和约束每个粒子的运动即可测定和改变流体的运动。但是大多数方法通常要求已知流体的物理属性(例如粘性),并且需要粒子的运动信息(位置和速度)作为训练数据,这在真实场景中几乎不太可能。

针对流体力学模型难以刻画和求解的问题,本文提出一种名为NeuroFluid的神经网络方法,实现流体动态反演(fluid dynamics grounding),**即根据稀疏视角下对流体的2D表观视觉观察,推断推流体内在的3D物理运动状态,**例如粒子的速度和位置等。如图2所示,NeuroFluid包含基于神经网络的流体粒子状态转移模型(Particle Transition Model)和由粒子驱动的神经网络渲染器(PhysNeRF),并将二者整合到一个端到端的联合优化框架中。优化过程包含三个阶段: **1. 模拟:**粒子状态转移模型根据初始状态(可用立体视觉方法粗估)预测流体粒子在后续时刻的运动轨迹;

**2. 渲染:**神经网络渲染器PhysNeRF(图2右)根据粒子的几何信息将模拟结果渲染成图像; **3. 比对:**渲染图像和真实图像比对,计算误差,通过梯度反向传递优化模型参数。

图2. NeuroFluid的训练过程(图左)及PhysNeRF的渲染示意(图右)

本文使用的流体数据(HoneyCone、WaterCube、WaterSphere)具有不同的物理属性(如密度、粘度、颜色)或初始状态(如流体粒子位置、整体形态)。

下列的实验从粒子动态反演、未来状态预测、新视角图像渲染、PhysNeRF域外场景泛化,验证了NeuroFluid的有效性。

1 实验1:流体粒子动态反演

本实验计算从图像反演的粒子位置与真实粒子位置之间的距离误差(Pred2GT distance),作为评价指标。图3展示了NeuroFluid与流体粒子预测的有监督方法DLF[1]的数值结果对比,显然,NeuroFluid从视频中反演的流体粒子状态比DLF(用粒子运动速度和位置作为训练数据)更准确。图4对模型的粒子状态推断结果做了可视化,注意到随着时间的推移,NeuroFluid相比基线模型,其反演结果运动更加自然,能更好地匹配真实流体动态。

图3. NeuroFluid(浅蓝色)在三个测试集上关于流体粒子位置的反演结果,相比流体粒子仿真的有监督模型DLF,NeuroFluid从图像推理流体内部状态,明显具有更好的准确性

图4. NeuroFluid(第三行)在WaterCube场景中对流体粒子位置的推断结果,图中第一行为生成对应观测图像序列时所使用的“真实”流体粒子位置

2 实验2:流体未来状态预测

在有效学习了流体的粒子状态转移模型后,可以很方便地实现预测流体在未来时刻的运动状态。如图5所示,本实验评估未来十个时刻内,模型预测的粒子位置与真实情况的误差。结果表明,NeuroFluid能够通过视觉观测学习流体运动的规律,推演合理的流体未来动态。

图5. 流体未来状态预测误差。其中,DLF*表示将基线模型在与测试场景物理属性相近的数据上进行微调;DLF+表示将基线模型直接在测试场景上进行微调

3 实验3:流体场景的新视角图像渲染

为了验证PhysNeRF渲染器的有效性,本实验在新视角合成(novel view synthesis)的任务上,广泛对比了各种基于神经隐式场的可微渲染技术,包括NeRF[2],NeRT-T (即NeRF+Time Index), D-NeRF[3]和Li et al. (2022)[4]等。如图6所示,在输入了粒子几何信息的情况下,NeuroFluid的渲染结果不仅在动态上与目标结果的匹配度最高,而且可以更好地渲染出流体的细节(如溅起的水珠)。

图6. 新视角合成结果对比,左起第一列为新视角下的目标图像

4 实验4: 域外场景泛化

PhysNeRF的基本假设是流体图像渲染应以粒子状态为驱动,故而应具有不同粒子分布下的强大泛化能力。为验证其泛化能力,本实验在使用有限的场景训练好PhysNeRF渲染器后,在测试时改变了流体的初始形貌,如图7所示,该几何形状为计算机图形学经典的Stanford Bunny。值得注意的是,在没有用Stanford Bunny数据对模型进行训练微调的情况下,PhysNeRF较为精细地渲染出了流体的表面细节。

图7. PhysNeRF在域外流体场景(训练所未见)上的泛化效果

总结:**上海交通大学AI+Science研究团队所提出的NeuroFluid模型能成功拟合符合视觉观测的流体运动转移规律,****从视觉表观观测反演流体内在运动,**有望为传统流体力学无法准确刻画的复杂流体运动(如湍流)提供一种全新的计算范式。

论文作者

官善琰 上海交通大学2017级直博生,本科毕业于西安电子科技大学电子信息工程专业。主要研究兴趣为人体重建与驱动、隐式神经渲染。

邓画予 上海交通大学2018级IEEE试点班计算机科学与技术方向本科生,2022级计算机系直博生。主要研究方向为深度学习,隐式神经渲染。

王韫博(通讯作者) 上海交通大学人工智能研究院助理教授。主要研究方向为预测学习、自监督学习、有模型强化学习。近三年在NeurIPS、ICML、TPAMI等CCF-A类会议与期刊上发表论文十余篇。

杨小康 上海交通大学人工智能研究院常务副院长,长江学者特聘教授、国家杰出青年科学基金获得者、IEEE Fellow。主要研究图像处理与机器学习,获国家科技进步二等奖、中国电子学会自然科学一等奖、上海市科技进步一等奖、国家研究生教育成果二等奖。任上海市图像图形学会理事长、教育部人工智能科技创新专家组委员、IEEE TMM 编委。

参考文献: [1] Ummenhofer, Benjamin, et al. Lagrangian fluid simulation with continuous convolutions. In ICLR, 2019. [2] Mildenhall, Ben, et al. NeRF: Representing scenes as neural radiance fields for view synthesis. In ECCV,2020. [3] Pumarola, Albert, et al. D-NeRF: Neural radiance fields for dynamic scenes. In CVPR, 2021. [4] Li, Yunzhu, et al. 3D neural scene representations for visuomotor control. In CoRL, 2022.

文稿 | 官善琰、王韫博 责任编辑 | 黄蕾宇

成为VIP会员查看完整内容
23

相关内容

国际机器学习大会(International Conference on Machine Learning,简称ICML ) 是由国际机器学习学会(IMLS)主办的机器学习国际顶级会议,也是CCF-A类学术会议。ICML 2022 共收到5630 投稿,接收1117 篇 short oral,118篇 long oral,录用率为21.94%。
【ICML2022】通过能量最小化学习迭代推理
专知会员服务
25+阅读 · 2022年7月3日
专知会员服务
23+阅读 · 2021年9月22日
专知会员服务
26+阅读 · 2021年7月11日
专知会员服务
25+阅读 · 2021年6月25日
专知会员服务
22+阅读 · 2021年6月14日
专知会员服务
36+阅读 · 2021年6月3日
【ICML2021】学习分子构象生成的梯度场
专知会员服务
14+阅读 · 2021年5月30日
专知会员服务
21+阅读 · 2021年5月27日
专知会员服务
27+阅读 · 2021年5月24日
专知会员服务
81+阅读 · 2021年5月10日
【ICML2022】通过能量最小化学习迭代推理
人工智能,装在罐子里
学术头条
0+阅读 · 2022年4月13日
将隐式神经表示(INR)用于2D图像
PaperWeekly
0+阅读 · 2022年3月12日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Multiface: A Dataset for Neural Face Rendering
Arxiv
0+阅读 · 2022年7月22日
Arxiv
0+阅读 · 2022年7月20日
Arxiv
0+阅读 · 2022年7月18日
Arxiv
0+阅读 · 2022年7月12日
VIP会员
相关VIP内容
【ICML2022】通过能量最小化学习迭代推理
专知会员服务
25+阅读 · 2022年7月3日
专知会员服务
23+阅读 · 2021年9月22日
专知会员服务
26+阅读 · 2021年7月11日
专知会员服务
25+阅读 · 2021年6月25日
专知会员服务
22+阅读 · 2021年6月14日
专知会员服务
36+阅读 · 2021年6月3日
【ICML2021】学习分子构象生成的梯度场
专知会员服务
14+阅读 · 2021年5月30日
专知会员服务
21+阅读 · 2021年5月27日
专知会员服务
27+阅读 · 2021年5月24日
专知会员服务
81+阅读 · 2021年5月10日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员