MIT谷歌伯克利三强联手 ,AI创造超现实主义3D运动雕塑

2018 年 9 月 23 日 新智元

新智元 AI World 2018 世界人工智能峰会

全程回顾

新智元于9月20日在北京国家会议中心举办AI WORLD 2018世界人工智能峰会,邀请机器学习教父、CMU教授 Tom Mitchell,迈克思·泰格马克,周志华,陶大程,陈怡然等AI领袖一起关注机器智能与人类命运。


爱奇艺

上午:https://www.iqiyi.com/v_19rr54cusk.html

下午:https://www.iqiyi.com/v_19rr54hels.html

新浪:http://video.sina.com.cn/l/p/1724373.html







  新智元报道  

来源:venturebeat

作者:Kyle Wiggers  编译:肖琴

【新智元导读】你知道3D运动雕塑吗?MIT、Google和UC Berkeley的研究人员创建了一个名为MoSculp的AI系统,只需视频输入,利用AI检测人体2D图像并恢复成3D模型,就能创造出超现实主义的3D运动雕塑。

震撼!AI WORLD 2018世界人工智能峰会开场视频


雕塑大家都认识,3D电影想必大家也都看过,但你知道3D运动雕塑吗?


简单地说,这是一种独特的展示人体如何运动的方式。3D运动雕塑(3D motion sculpture)可以将任何物体的移动路径形成3D视图,物体的形状、运动轨迹都会影响最后的效果。



将雕塑和3D这两种艺术混合起来的这些作品,是由MIT计算机科学与人工智能实验室、Google Research以及加州大学伯克利分校的研究人员共同创造的。他们利用AI系统产生了这些超现实主义的运动与姿势的混合


作为输入的运动影像


创作3D运动雕塑


这个系统被称为MoSculp,在论文《MoSculp:形状和时间的交互式可视化》中有详细描述。该论文将于下个月在德国柏林的用户界面软件与技术大会(UIST)上发表。


论文的第一作者、MIT博士生张修明(Xiuming Zhang)认为,这一技术可以用来为想要提高技能的运动员提供详细的运动研究。


3D运动雕塑可用作运动研究

张修明说:“想象一下,你有一段费德勒在网球比赛中发球的视频,还有一段你自己练习打网球的视频。你可以用MoSculp创建两种场景的运动雕塑,然后进行对比,更全面地研究你需要改进的地方。”



具体来说,这个系统的工作有多个步骤:


首先,MoSculp能够检测人体及其2D姿态,利用的是CMU感知计算实验室开发的多人关键点实时检测库OpenPose,估计每个帧中的关键点(踝关节,肘关节,髋关节等)。


自动检测关键点


接下来,MoSculp将2D姿态恢复成一个3D人体模型,展现人体的整体形状和人体随时间运动的姿态。



AI通过3D空间扫描这个模型,以创建初始运动雕塑,但正如研究人员指出的那样,这个模型缺乏纹理和结构细节,比如精细的面部结构、头发和衣服。


有没有聪明的解决方案呢?


研究人员提出将雕塑插入到原始视频中,而不是将3D内容从视频映射到场景中。


为了防止出现伪影和遮挡,MoSculp估计出每个帧中人物和雕塑的深度图(depth map),并将两者进行比较,以确定人是比雕塑更接近摄像机还是更原理摄像机。


然后,MoSculp从所有帧中提取主体的前景蒙版,以细化初始深度图。


原始视频


估计模型


以下是该系统在实践中的工作原理:


将视频加载到系统后,MoSculp将检测到的关键点覆盖在输入帧上,并通过几个随机选择的帧来验证。(内置的校正工具可以让用户在必要时进行调整。)在对“暂时不一致的检测”进行校正后,它会生成运动雕塑,并将其加载到自定义界面中。


在MoSculp中,用户可以在雕塑周围导航,或使用3D打印机进行打印。系统提供工具允许用户自定义材料、身体部位、场景背景、光照条件和其他美学特征。


MoSculp的界面


目前,MoSculp只使用于单个主体的视频,不过研究团队希望将其扩展到多人。未来,他们认为这个系统可以用来研究社会障碍、团队动力和人际互动等。


“舞蹈和高技能运动通常看起来像'移动的雕塑',但它们只能形成稍纵即逝的短暂形状,”Adobe传播负责人Courtney Brigham说。 


“这项工作展示了如何利用动作,并将动作转换为具有客观运动可视化的真实雕塑,为运动员提供了一种分析他们的训练动作的方式,而且成本只需一台运动相机和一些计算时间。”



参考资料

https://venturebeat.com/2018/09/19/mit-csail-uses-ai-to-create-3d-motion-sculptures/2/



新智元AI WORLD 2018

世界人工智能峰会全程回顾


新智元于9月20日在北京国家会议中心举办AI WORLD 2018世界人工智能峰会,邀请机器学习教父、CMU教授 Tom Mitchell,迈克思·泰格马克,周志华,陶大程,陈怡然等AI领袖一起关注机器智能与人类命运。


全程回顾新智元 AI World 2018 世界人工智能峰会盛况: 

爱奇艺 

上午:https://www.iqiyi.com/v_19rr54cusk.html 

下午:https://www.iqiyi.com/v_19rr54hels.html

新浪:http://video.sina.com.cn/l/p/1724373.html


登录查看更多
5

相关内容

3D是英文“Three Dimensions”的简称,中文是指三维、三个维度、三个坐标,即有长、有宽、有高,换句话说,就是立体的,是相对于只有长和宽的平面(2D)而言。
CVPR 2020 最佳论文与最佳学生论文!
专知会员服务
35+阅读 · 2020年6月17日
3D目标检测进展综述
专知会员服务
191+阅读 · 2020年4月24日
【Google AI】开源NoisyStudent:自监督图像分类
专知会员服务
54+阅读 · 2020年2月18日
MIT新书《强化学习与最优控制》
专知会员服务
275+阅读 · 2019年10月9日
用Python制作3D动画
Python程序员
30+阅读 · 2018年1月17日
Equalization Loss for Long-Tailed Object Recognition
Arxiv
5+阅读 · 2020年4月14日
Mesh R-CNN
Arxiv
4+阅读 · 2019年6月6日
Arxiv
12+阅读 · 2019年1月24日
ViZDoom Competitions: Playing Doom from Pixels
Arxiv
5+阅读 · 2018年9月10日
Text classification using capsules
Arxiv
5+阅读 · 2018年8月12日
Arxiv
5+阅读 · 2018年3月30日
VIP会员
相关论文
Top
微信扫码咨询专知VIP会员