来自国防科技大学的王浩天博士论文,入选2025年度“CCF博士学位论文激励计划”初评结果!

从观察视频中重建动态三维人体表示是计算机视觉和图形学领域的前沿热点问题,是数字内容制作、远程虚拟会议、影视制作等应用的重要技术。传统的人体建模技术可以构建高精度的数字人体模型,但这些方法依赖于复杂的硬件设备,如深度相机、精密相机阵列,限制了这些工作的使用场景,并且提高了建模成本和用户门槛。近年来,神经辐射场展现了从观察图片中重建高质量三维场景的能力。但此类方法需要观测视图的输入,并且无法建模可驱动的动态人体模型。除此之外,此类方法的渲染速度较慢,无法满足实时应用的需求。 基于多视图几何理论与深度学习方法相结合的思想,本文提出了一系列面向结构化建模与渲染的隐式神经表示方法,致力于解决稀疏视角视频重建、可驱动人体模型、几何表面重建、实时渲染等可入人体建模领域的关键问题,实现了从稀疏视角视频中创建高质量的可驱动人体模型。本文主要的研究成果如下: (1)针对从稀疏视角视频重建动态三维人体模型的问题,本文提出了一种基于结构化偏差变量的人体神经辐射场表示,可以有效地整合输入视频中不同时刻的观测信息。实验结果表明本方法可以从稀疏视角视频甚至单目视频中重建高质量的三维人体。 (2)针对可驱动的数字人体建模问题,本文提出了一种基于骨骼蒙皮驱动的人体神经辐射场表示,将动态人体建模为空间变形场和标准空间下的神经辐射场。本文在 Human3.6M 和 ZJU-MoCap 数据集上验证了该方法的有效性。 (3)针对从视频中重建高质量人体几何的问题,本文提出了一种基于符号距离场的动态人体几何表示,利用稀疏方程对几何优化过程施加正则化。在多个数据集上的实验结果表明,本方法在人体几何重建方面大幅度地超过了之前的方法。 (4)针对动态人体的实时渲染问题,本文提出了一种基于多层感知机的动态场景表示,通过一组少量多层感知机网络建模全动态场景,从而降低了网络的推理成本,提升了渲染速度。在 NHR 和 ZJU-MoCap 数据集上的实验结果表明,本方法在渲染速度方面远远超过了之前的方法,并且在渲染质量上表现出了最好的效果。

关键词:三维人体建模,隐式神经表示,神经渲染

点击“阅读原文”,查看下载本文

成为VIP会员查看完整内容
14

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
【博士论文】图表示学习的谱理论与自监督学习
专知会员服务
41+阅读 · 2023年11月30日
【博士论文】大规模预训练语言模型的高效适配技术研究
专知会员服务
60+阅读 · 2023年11月29日
【博士论文】图像数据先验的数学建模及其应用
专知会员服务
25+阅读 · 2022年12月29日
【博士论文】面向大规模部署的室内定位关键技术研究
专知会员服务
25+阅读 · 2022年12月19日
【博士论文】自然场景中不规则文字的检测和识别研究
专知会员服务
29+阅读 · 2022年12月18日
【博士论文】开放域文本的结构化知识获取
专知会员服务
48+阅读 · 2022年12月17日
【博士论文】深度卷积神经网络架构设计及优化问题研究
专知会员服务
51+阅读 · 2022年12月11日
【博士论文】图处理加速架构研究
专知会员服务
26+阅读 · 2022年12月10日
【综述】多智能体强化学习算法理论研究
深度强化学习实验室
15+阅读 · 2020年9月9日
【长文综述】基于图神经网络的知识图谱研究进展
深度学习自然语言处理
15+阅读 · 2020年8月23日
CCCF专栏文章:人机共融智能
中国计算机学会
15+阅读 · 2017年12月21日
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2016年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Arxiv
174+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
491+阅读 · 2023年3月31日
Arxiv
81+阅读 · 2023年3月26日
Arxiv
177+阅读 · 2023年3月24日
Arxiv
25+阅读 · 2023年3月17日
VIP会员
相关VIP内容
【博士论文】图表示学习的谱理论与自监督学习
专知会员服务
41+阅读 · 2023年11月30日
【博士论文】大规模预训练语言模型的高效适配技术研究
专知会员服务
60+阅读 · 2023年11月29日
【博士论文】图像数据先验的数学建模及其应用
专知会员服务
25+阅读 · 2022年12月29日
【博士论文】面向大规模部署的室内定位关键技术研究
专知会员服务
25+阅读 · 2022年12月19日
【博士论文】自然场景中不规则文字的检测和识别研究
专知会员服务
29+阅读 · 2022年12月18日
【博士论文】开放域文本的结构化知识获取
专知会员服务
48+阅读 · 2022年12月17日
【博士论文】深度卷积神经网络架构设计及优化问题研究
专知会员服务
51+阅读 · 2022年12月11日
【博士论文】图处理加速架构研究
专知会员服务
26+阅读 · 2022年12月10日
相关基金
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2016年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员