CMU发布新型“翻译机”,通过JL2P将文字翻译成肢体运动

2019 年 9 月 23 日 全球人工智能
大数据文摘出品   编译:Vicky、刘俊寰

如何在文字与运动之间建立起相关联系?

当文字是动词时这样的联系就显得简单,只需做出相应动作即可,比如对家里的狗子说“坐”,如果它听话,整个动作流程就算是完成了。

但是如果是更复杂的文字呢,比如名词,甚至是句子?

近日,卡耐基·梅隆大学(CMU)的AI研究人员发明了能将文字转化成肢体运动的人工智能代理(AI agent),这个方法被称为联合语言姿势(Joint Language-to-Pose,JL2P),通过JL2P能够将自然语言与3D姿势模型相结合。

目前限于简笔画,但发展潜力巨大


JL2P与之前将文字转化为图像的部分作品相一致,比如微软的ObjGAN能从字幕中勾勒出图像和故事板,迪斯尼的AI能用脚本中的文字来创建故事板,英伟达(Nvidia)的GauGAN允许用户用标有“树”、“山”或“天空”这样单词的画笔描绘风景。

微软ObjGAN相关链接:
https://venturebeat.com/2019/06/17/microsoft-researchers-use-gans-to-generate-images-and-storyboards-from-captions/

迪斯尼AI相关链接:
https://venturebeat.com/2019/04/12/disneys-ai-generates-storyboard-animations-from-screenplays/

英伟达GauGAN相关链接:
https://venturebeat.com/2019/03/18/nvidia-researchers-debut-gaugan-ai-that-creates-fake-landscapes-that-look-real/

JL2P是通过端到端的课程学习进行训练的,这种方法强调更短的任务完成顺序,然后才去实现更难的目标。

JL2P动画目前仅限于简笔画,但将文字转换为类人运动的能力有朝一日可以帮助类人型机器人在现实世界中执行物理任务,或是协助创作人员为视频游戏或电影等制作动画虚拟角色。


JL2P使用KIT运动语言数据集进行训练


JL2P能够执行诸如走路或跑步、演奏乐器(如吉他或小提琴)、遵循方向指示(向左或向右)、或控制速度(快或慢)等操作。该项工作最初于7月2日在arXiv.org上的一篇论文中进行了详细介绍,在9月19日于魁北克举行的3D视觉国际会议上由合著者和CMU语言技术研究所的研究员Chaitanya Ahuja进行了展示。

论文链接:
https://arxiv.org/abs/1907.01108

论文写道:“我们首先优化模型,来预测以完整句子为条件的2个时间步长。这项简单的任务有助于模型学习非常短的姿势序列,例如行走时的腿部动作、挥手时的手部动作和弯曲时的躯干动作。一旦验证集的损失开始增加,我们就进入课程的下一阶段。现在,该模型的预测姿势数是‘姿势数量’的两倍。”

JL2P声称,与SRI国际研究人员在2018年提出的最先进的人工智能相比,在人体运动建模方面有了9%的改进。

相关链接:
https://arxiv.org/abs/1804.10652

一位跪姿的人将手臂举到两侧并起立

一人奔跑着跳过障碍物

该数据集由德国高性能人形技术公司于2016年推出,其结合了人体运动与自然语言描述,将11小时的人类运动记录映射到约8个单词量的6200多个英语句子当中。

相关报道:

https://venturebeat.com/2019/09/11/ai-researchers-translate-language-into-physical-movement/


广告 & 商务合作请加微信:kellyhyw

投稿请发送至:mary.hu@aisdk.com


登录查看更多
3

相关内容

CVPR 2020 最佳论文与最佳学生论文!
专知会员服务
35+阅读 · 2020年6月17日
最新《自然场景中文本检测与识别》综述论文,26页pdf
专知会员服务
69+阅读 · 2020年6月10日
仅训练996个剧本,迪士尼用AI自动生成动画
机器学习算法与Python学习
7+阅读 · 2019年4月20日
基于姿态的人物视频生成【附PPT与视频资料】
人工智能前沿讲习班
32+阅读 · 2019年1月28日
【学界】 李飞飞学生最新论文:利用场景图生成图像
GAN生成式对抗网络
15+阅读 · 2018年4月9日
Equalization Loss for Long-Tailed Object Recognition
Arxiv
5+阅读 · 2020年4月14日
Arxiv
3+阅读 · 2019年3月29日
Arxiv
7+阅读 · 2018年4月11日
Arxiv
6+阅读 · 2018年1月29日
VIP会员
相关VIP内容
CVPR 2020 最佳论文与最佳学生论文!
专知会员服务
35+阅读 · 2020年6月17日
最新《自然场景中文本检测与识别》综述论文,26页pdf
专知会员服务
69+阅读 · 2020年6月10日
相关资讯
仅训练996个剧本,迪士尼用AI自动生成动画
机器学习算法与Python学习
7+阅读 · 2019年4月20日
基于姿态的人物视频生成【附PPT与视频资料】
人工智能前沿讲习班
32+阅读 · 2019年1月28日
【学界】 李飞飞学生最新论文:利用场景图生成图像
GAN生成式对抗网络
15+阅读 · 2018年4月9日
Top
微信扫码咨询专知VIP会员