华南理工TANGO项目原作解读: 文本驱动的三维物体风格化模型 - 专知

会员服务 ·

0

华南理工TANGO项目原作解读: 文本驱动的三维物体风格化模型

2022 年 11 月 29 日 机器之心

根据给定输入创建 3D 内容（例如，根据文本提示、图像或 3D 形状）在计算机视觉和图形领域具有重要应用。现实中通常需要专业艺术（Technical Artist）耗费大量的时间成本去创作 3D 内容。

为了减少人力消耗，实现整个流程的自动化，华南理工等机构的研究人员提出了TANGO — 一种根据文本指导三维物体风格化的方法。这一领域目前最相关的工作是 Text2Mesh，它使用了预训练模型 CLIP 作为指导，预测三维模型表面顶点的颜色和位置偏移，从而实现风格化。然而简单地预测表面顶点颜色通常会产生不真实的渲染效果，且不规则的顶点偏移会造成很严重的自交。因此，该研究借鉴传统的基于物理的渲染管线，将整个渲染过程解耦为 SVBRDF 材质，法向贴图和灯光的预测过程，并分别用球高斯函数表达解耦的元素。这种基于物理的解耦方式使得 TANGO 可以正确产生具有真实感的渲染效果，并具有很好的鲁棒性。

对于给定的文本输入和三维模型，TANGO 可以产生精细程度较高的具有照片级真实感的细节，并且不会在三维模型表面产生自交问题。同时，得益于 TANGO对渲染方程的物理解耦，我们能够对材质进行编辑和重新打光，实现对输出结果的控制。另外，由于 TANGO 采用预测法向贴图的方式增添物体表面细节，因此对于顶点数较少的三维模型也有很好的鲁棒性。

机器之心最新一期线上分享邀请到了华南理工大学 Gorilla Lab 一年级博士生陈永炜（导师为贾奎教授），为大家解读他们提出的文本驱动三维模型风格化方法——TANGO。

分享主题：TANGO: 文本驱动的三维物体风格化模型

分享嘉宾：陈永炜，华南理工大学 Gorilla Lab 一年级博士生。师从贾奎教授，研究方向为三维视觉，多模态学习，可微渲染，扩散模型等，相关研究工作曾在 CVPR、ECCV、NeurIPS 等计算机视觉和人工智能顶级会议上发表

分享摘要：本次分享将介绍一种基于文本驱动的三维模型风格化方法——TANGO，该方法对于给定的三维模型和文本，可以自动生成更具有真实性的 SVBRDF 材质，法向贴图和灯光，并且对低质量三维模型有更好的鲁棒性。该研究已被 NeurIPS 2022 接收为 spotlight。

相关链接：

1）SOTA！模型平台项目主页链接：

https://sota.jiqizhixin.com/project/tango

2）论文链接：

https://arxiv.org/abs/2210.11277

3）项目主页：

https://cyw-3d.github.io/tango/

4）机器之心推文：

https://mp.weixin.qq.com/s/ZCD1wk9Ox_cs3bmCYtA1SA

加群看直播

直播间 ：关注机器之心机动组视频号，北京时间 11 月 30 日 19:00 开播。

交流群： 本次直播设有 QA 环节，欢迎加入本次直播交流群探讨交流。

如群已超出人数限制，请添加机器之心小助手：syncedai2、syncedai3、syncedai4 或 syncedai5，备注「TANGO」即可加入。

如果你也有最新工作希望分享或提交你感兴趣的内容方向，随时告诉我们吧： https://jiqizhixin.mikecrm.com/fFruVd3

机器之心 · 机动组

机动组是机器之心发起的人工智能技术社区，聚焦于学术研究与技术实践主题内容，为社区用户带来技术线上公开课、学术分享、技术实践、走近顶尖实验室等系列内容。机动组也将不定期举办线下学术交流会与组织人才服务、产业技术对接等活动，欢迎所有 AI 领域技术从业者加入。

登录查看更多

0

相关内容

风格化

伦敦大学学院最新《三维图像合成技术》综述，26页pdf阐述3D图像合成技术进展

伦敦大学学院最新《三维图像合成技术》综述，26页pdf阐述3D图像合成技术进展

专知会员服务

34+阅读 · 2022年10月27日

多模态图像合成与编辑这么火，马普所、南洋理工等出了份详细综述

多模态图像合成与编辑这么火，马普所、南洋理工等出了份详细综述

专知会员服务

30+阅读 · 2022年8月24日

CVPR 2022 | 基于密度与深度分解的自增强非成对图像去雾

CVPR 2022 | 基于密度与深度分解的自增强非成对图像去雾

专知会员服务

13+阅读 · 2022年6月30日

CVPR2022最佳论文奖项出炉！苏黎世联邦理工等获最佳论文，同济大学等获最佳学生论文

CVPR2022最佳论文奖项出炉！苏黎世联邦理工等获最佳论文，同济大学等获最佳学生论文

专知会员服务

55+阅读 · 2022年6月21日

中科院自动化所17篇CVPR 2022 新作速览！

中科院自动化所17篇CVPR 2022 新作速览！

专知会员服务

20+阅读 · 2022年3月19日

多媒体顶会ACM Multimedia 2021各大奖项出炉！北航获最佳论文，NTU获最佳学生论文

多媒体顶会ACM Multimedia 2021各大奖项出炉！北航获最佳论文，NTU获最佳学生论文

专知会员服务

15+阅读 · 2021年10月23日

SIGGRAPH 2021 | 学习带神经融合形状的人物动画

专知会员服务

15+阅读 · 2021年6月1日

[CVPR 2021] 基于傅里叶轮廓嵌入的任意形状文本检测（有源码）

专知会员服务

18+阅读 · 2021年5月8日

【CVPR2021】GAN人脸预训练模型

【CVPR2021】GAN人脸预训练模型

专知会员服务

24+阅读 · 2021年4月10日

姿势服装随心换-CVPR2019

姿势服装随心换-CVPR2019

专知会员服务

36+阅读 · 2020年1月26日

中科大NDR项目原作解读：基于单目RGB-D视频的动态重建

中科大NDR项目原作解读：基于单目RGB-D视频的动态重建

机器之心

1+阅读 · 2022年11月18日

NeurIPS 2022 | 一句话让三维模型生成逼真外观风格，精细到照片级细节

NeurIPS 2022 | 一句话让三维模型生成逼真外观风格，精细到照片级细节

机器之心

0+阅读 · 2022年10月29日

南洋理工大学 MMLab 团队分享 | 元宇宙基石：文本驱动的数字内容生成

南洋理工大学 MMLab 团队分享 | 元宇宙基石：文本驱动的数字内容生成

机器之心

1+阅读 · 2022年10月14日

马普所智能系统系与苏黎世联邦理工AIT团队，带你全景式领略3D数字人前沿研究

马普所智能系统系与苏黎世联邦理工AIT团队，带你全景式领略3D数字人前沿研究

机器之心

0+阅读 · 2022年3月31日

CVPR 2022 | 百变发型！中科大等提出HairCLIP：基于文本和参考图像的头发编辑方法

CVPR 2022 | 百变发型！中科大等提出HairCLIP：基于文本和参考图像的头发编辑方法

极市平台

0+阅读 · 2022年3月13日

3张图片生成一个手办3D模型！南加州大学华人博士提出新模型NeROIC，更真实！

3张图片生成一个手办3D模型！南加州大学华人博士提出新模型NeROIC，更真实！

新智元

1+阅读 · 2022年2月24日

【速览】ICCV 2021 | 从2D到3D的虚拟试穿模型

【速览】ICCV 2021 | 从2D到3D的虚拟试穿模型

中国图象图形学学会CSIG

0+阅读 · 2021年10月22日

【分享】TCSVT 2021丨基于3D人脸动态的图像-视频生成方法

【分享】TCSVT 2021丨基于3D人脸动态的图像-视频生成方法

中国图象图形学学会CSIG

0+阅读 · 2021年8月20日

【动态】CSIG图像图形中国行在大连理工大学成功举办

【动态】CSIG图像图形中国行在大连理工大学成功举办

中国图象图形学学会CSIG

0+阅读 · 2021年8月6日

【华南理工大学ICCV-CVPR2019】基于单一的RGB图像的拓扑感知的三维物体重建

【华南理工大学ICCV-CVPR2019】基于单一的RGB图像的拓扑感知的三维物体重建

专知

18+阅读 · 2020年1月15日

GPU加速和风格感知的艺术图像和谐克隆

国家自然科学基金

4+阅读 · 2014年12月31日

基于动态点云的人脸表情建模和编辑方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于图像的室外场景光影分析与编辑

国家自然科学基金

0+阅读 · 2013年12月31日

基于图模型的场景文字与叠加文字提取识别技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于随机回归森林与多源数据融合的高精度三维动态形状获取

国家自然科学基金

0+阅读 · 2012年12月31日

虚拟现实中基于图像的纹理力触觉表达与再现方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

复杂形体时空动态变化生成技术

国家自然科学基金

0+阅读 · 2012年12月31日

基于物体棱线线流场的三维物体运动估计与结构重建研究

国家自然科学基金

0+阅读 · 2011年12月31日

风格化人体运动合成新方法研究

国家自然科学基金

0+阅读 · 2011年12月31日

用于增强现实动态虚实遮挡问题的编码孔径图像深度获取方法研究

国家自然科学基金

2+阅读 · 2009年12月31日

UDepth: Fast Monocular Depth Estimation for Visually-guided Underwater Robots

UDepth: Fast Monocular Depth Estimation for Visually-guided Underwater Robots

Arxiv

0+阅读 · 2023年2月2日

IKOL: Inverse kinematics optimization layer for 3D human pose and shape estimation via Gauss-Newton differentiation

Arxiv

0+阅读 · 2023年2月2日

Neural Shape Deformation Priors

Arxiv

0+阅读 · 2023年2月1日

The Spatial Kernel Predictor based on Huge Observation Sets

Arxiv

0+阅读 · 2023年2月1日

PV3D: A 3D Generative Model for Portrait Video Generation

Arxiv

0+阅读 · 2023年2月1日

Neural Wavelet-domain Diffusion for 3D Shape Generation, Inversion, and Manipulation

Arxiv

0+阅读 · 2023年2月1日

Adversarial Training of Self-supervised Monocular Depth Estimation against Physical-World Attacks

Arxiv

0+阅读 · 2023年1月31日

A Bias-Variance-Privacy Trilemma for Statistical Estimation

Arxiv

0+阅读 · 2023年1月30日

A Mathematical Introduction to Generative Adversarial Nets (GAN)

A Mathematical Introduction to Generative Adversarial Nets (GAN)

Arxiv

27+阅读 · 2020年9月1日

3D Hand Shape and Pose Estimation from a Single RGB Image

3D Hand Shape and Pose Estimation from a Single RGB Image

Arxiv

17+阅读 · 2019年3月3日

VIP会员

相关主题

相关VIP内容

伦敦大学学院最新《三维图像合成技术》综述，26页pdf阐述3D图像合成技术进展

伦敦大学学院最新《三维图像合成技术》综述，26页pdf阐述3D图像合成技术进展

专知会员服务

34+阅读 · 2022年10月27日

多模态图像合成与编辑这么火，马普所、南洋理工等出了份详细综述

多模态图像合成与编辑这么火，马普所、南洋理工等出了份详细综述

专知会员服务

30+阅读 · 2022年8月24日

CVPR 2022 | 基于密度与深度分解的自增强非成对图像去雾

CVPR 2022 | 基于密度与深度分解的自增强非成对图像去雾

专知会员服务

13+阅读 · 2022年6月30日

CVPR2022最佳论文奖项出炉！苏黎世联邦理工等获最佳论文，同济大学等获最佳学生论文

CVPR2022最佳论文奖项出炉！苏黎世联邦理工等获最佳论文，同济大学等获最佳学生论文

专知会员服务

55+阅读 · 2022年6月21日

中科院自动化所17篇CVPR 2022 新作速览！

中科院自动化所17篇CVPR 2022 新作速览！

专知会员服务

20+阅读 · 2022年3月19日

多媒体顶会ACM Multimedia 2021各大奖项出炉！北航获最佳论文，NTU获最佳学生论文

多媒体顶会ACM Multimedia 2021各大奖项出炉！北航获最佳论文，NTU获最佳学生论文

专知会员服务

15+阅读 · 2021年10月23日

SIGGRAPH 2021 | 学习带神经融合形状的人物动画

专知会员服务

15+阅读 · 2021年6月1日

[CVPR 2021] 基于傅里叶轮廓嵌入的任意形状文本检测（有源码）

专知会员服务

18+阅读 · 2021年5月8日

【CVPR2021】GAN人脸预训练模型

【CVPR2021】GAN人脸预训练模型

专知会员服务

24+阅读 · 2021年4月10日

姿势服装随心换-CVPR2019

姿势服装随心换-CVPR2019

专知会员服务

36+阅读 · 2020年1月26日

热门VIP内容

开通专知VIP会员享更多权益服务

《分层多智能体系统分类：设计范式、协调机制与工业应用》最新28页

《人与智能体在系统工程建模语言V2任务中的性能表现：基于用户中心化的评估方法》308页

《太空对抗中未知追踪者目标下的规避策略研究》122页

AlphaMosaic：人工智能赋能的作战管理系统

相关资讯

中科大NDR项目原作解读：基于单目RGB-D视频的动态重建

中科大NDR项目原作解读：基于单目RGB-D视频的动态重建

机器之心

1+阅读 · 2022年11月18日

NeurIPS 2022 | 一句话让三维模型生成逼真外观风格，精细到照片级细节

NeurIPS 2022 | 一句话让三维模型生成逼真外观风格，精细到照片级细节

机器之心

0+阅读 · 2022年10月29日

南洋理工大学 MMLab 团队分享 | 元宇宙基石：文本驱动的数字内容生成

南洋理工大学 MMLab 团队分享 | 元宇宙基石：文本驱动的数字内容生成

机器之心

1+阅读 · 2022年10月14日

马普所智能系统系与苏黎世联邦理工AIT团队，带你全景式领略3D数字人前沿研究

马普所智能系统系与苏黎世联邦理工AIT团队，带你全景式领略3D数字人前沿研究

机器之心

0+阅读 · 2022年3月31日

CVPR 2022 | 百变发型！中科大等提出HairCLIP：基于文本和参考图像的头发编辑方法

CVPR 2022 | 百变发型！中科大等提出HairCLIP：基于文本和参考图像的头发编辑方法

极市平台

0+阅读 · 2022年3月13日

3张图片生成一个手办3D模型！南加州大学华人博士提出新模型NeROIC，更真实！

3张图片生成一个手办3D模型！南加州大学华人博士提出新模型NeROIC，更真实！

新智元

1+阅读 · 2022年2月24日

【速览】ICCV 2021 | 从2D到3D的虚拟试穿模型

【速览】ICCV 2021 | 从2D到3D的虚拟试穿模型

中国图象图形学学会CSIG

0+阅读 · 2021年10月22日

【分享】TCSVT 2021丨基于3D人脸动态的图像-视频生成方法

【分享】TCSVT 2021丨基于3D人脸动态的图像-视频生成方法

中国图象图形学学会CSIG

0+阅读 · 2021年8月20日

【动态】CSIG图像图形中国行在大连理工大学成功举办

【动态】CSIG图像图形中国行在大连理工大学成功举办

中国图象图形学学会CSIG

0+阅读 · 2021年8月6日

【华南理工大学ICCV-CVPR2019】基于单一的RGB图像的拓扑感知的三维物体重建

【华南理工大学ICCV-CVPR2019】基于单一的RGB图像的拓扑感知的三维物体重建

专知

18+阅读 · 2020年1月15日

相关基金

GPU加速和风格感知的艺术图像和谐克隆

国家自然科学基金

4+阅读 · 2014年12月31日

基于动态点云的人脸表情建模和编辑方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于图像的室外场景光影分析与编辑

国家自然科学基金

0+阅读 · 2013年12月31日

基于图模型的场景文字与叠加文字提取识别技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于随机回归森林与多源数据融合的高精度三维动态形状获取

国家自然科学基金

0+阅读 · 2012年12月31日

虚拟现实中基于图像的纹理力触觉表达与再现方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

复杂形体时空动态变化生成技术

国家自然科学基金

0+阅读 · 2012年12月31日

基于物体棱线线流场的三维物体运动估计与结构重建研究

国家自然科学基金

0+阅读 · 2011年12月31日

风格化人体运动合成新方法研究

国家自然科学基金

0+阅读 · 2011年12月31日

用于增强现实动态虚实遮挡问题的编码孔径图像深度获取方法研究

国家自然科学基金

2+阅读 · 2009年12月31日

相关论文

UDepth: Fast Monocular Depth Estimation for Visually-guided Underwater Robots

UDepth: Fast Monocular Depth Estimation for Visually-guided Underwater Robots

Arxiv

0+阅读 · 2023年2月2日

IKOL: Inverse kinematics optimization layer for 3D human pose and shape estimation via Gauss-Newton differentiation

Arxiv

0+阅读 · 2023年2月2日

Neural Shape Deformation Priors

Arxiv

0+阅读 · 2023年2月1日

The Spatial Kernel Predictor based on Huge Observation Sets

Arxiv

0+阅读 · 2023年2月1日

PV3D: A 3D Generative Model for Portrait Video Generation

Arxiv

0+阅读 · 2023年2月1日

Neural Wavelet-domain Diffusion for 3D Shape Generation, Inversion, and Manipulation

Arxiv

0+阅读 · 2023年2月1日

Adversarial Training of Self-supervised Monocular Depth Estimation against Physical-World Attacks

Arxiv

0+阅读 · 2023年1月31日

A Bias-Variance-Privacy Trilemma for Statistical Estimation

Arxiv

0+阅读 · 2023年1月30日

A Mathematical Introduction to Generative Adversarial Nets (GAN)

A Mathematical Introduction to Generative Adversarial Nets (GAN)

Arxiv

27+阅读 · 2020年9月1日

3D Hand Shape and Pose Estimation from a Single RGB Image

3D Hand Shape and Pose Estimation from a Single RGB Image

Arxiv

17+阅读 · 2019年3月3日

大家都在搜

CMU博士论文

无人机集群

软件无线电

国防科技创新

无人机航拍交通事故现场勘查处置系统——行业第一的警用事故处理软件

微信扫码咨询专知VIP会员