波士顿动力机器人热舞背后藏着哪些秘密?工程副总裁揭秘

2021 年 1 月 11 日 机器之心

选自IEEE Spectrum

作者:Evan Ackerman

机器之心编译

编辑:小舟、张倩

机器人怎么学会跳舞的?最新视频有无作假?…… 波士顿动力工程副总裁 Aaron Saunders 为大家一一解惑。


一周前,波士顿动力上传了一段机器人跳舞的视频,人形机器人 Atlas、机器狗 Spot、双轮机器人 Handle 伴随着 The Contours 的歌曲《Do You Love Me》翩翩起舞,该视频的观看量已达 2400 多万次。


这段视频的独特之处在于其艺术性。在此之前,人形机器人 Atlas 可以完成一些实际任务,也可以做一些体操运动和跑酷运动,但跳舞确实是件新鲜事。


为了了解这段舞蹈背后的故事,IEEE Spectrum 采访了波士顿动力公司工程副总裁 Aaron Saunders。Saunders 从 2003 年开始就在波士顿动力工作,是波士顿动力「LittleDog」机器人的两位设计者之一。同时,他也是 Atlas 项目的重要成员,从项目伊始就参与研发,在过去的几年中,Saunders 一直是 Atlas 的负责人。

以下是采访的具体内容。

您如何看待网友对这段机器人跳舞视频的反应?

我们收到了对这段视频的各种期待,这绝对是非常大的乐趣。YouTube 上的回应为我们刷新了纪录:我们收到了数百封电子邮件和电话。致电者表达了他们的热情,并分享了他们对我们下一步工作、对这首歌以及对机器人舞步的看法,这些建议都很有趣。我最喜欢的回应是从我 94 岁的奶奶那里得到的。她观看了这段视频,然后发送了一条信息,询问是不是我教会这些机器人跳舞的。我认为这段视频的受众比预期广泛,原因是它将经典音乐和新技术融合在了一起。

此前我们并没有见过 Atlas 有这样的动作,您能讲讲这是如何做到的吗?

首先,我们与舞者和编舞合作,编出了一套舞蹈动作,以此来作为这段舞蹈的基础。对 Atlas 来说,最大的挑战就是将人类的舞蹈动作改编成机器人可以做到的动作。为此,我们使用仿真模拟来快速迭代动作概念,同时从编舞者那里征求反馈,使得编出的动作在 Atlas 力量和速度所允许的范围内。这个过程需要迭代多次——舞者和编舞会跳出他们想让我们实现的动作,工程师会盯着屏幕看,给出各种评价,比如「这个简单」、「这个很难」或「这个吓到我了」。然后我们会展开讨论,在模拟中尝试不同的情况,对动作做出调整,以找到可以在 Atlas 上执行的动作集。

在整个项目中,随着我们构建的工具越来越多,创建新舞蹈动作所需的时间变得越来越短。例如,在开始拍摄的前一天,我们使用工具链创建了一个 Atlas 芭蕾动作,仅用一天就创建成功。因此,这个过程不是手动创建脚本或手动编码,而是创建一条允许你尝试各种动作的 pipeline,你可以通过各种输入来描述这些动作,并让机器人执行。


在将人类舞蹈动作转换为 Atlas 动作的过程中,是否遇到了非常困难的问题?或者有没有 Atlas 能比人类做得更好的地方?

芭蕾舞中的一些旋转动作需要更多次迭代才能在 Atlas 上执行,因为这种动作和跳跃、奔跑相差最大,我们的经验相对较少。它们对机器和软件都提出了新的挑战。我们学到的教训是:不要低估舞者的灵活性和力量。我们选的都是优秀的舞者,让机器人去做他们的动作确实太难了。

从根本上讲,我认为 Atlas 并不具备这些舞者所具备的运动能力和力量,但我们会继续朝着这个方向改进。因为我们相信,如果想让机器人广泛应用于商业领域,最终走入家庭,这样的性能是它们必不可少的。

机器人真正擅长的事情是以完全相同的方式一遍又一遍地重复做一件事,因此,当我们令其执行我们想要的动作时,机器人就可以重复执行,同时我们会从不同的角度拍摄视频。

我能够理解您借助人类舞者帮助 Atlas 编舞,那么 Spot 和 Handle 是怎么做到的呢?

我们的合作者在对运动的思考上和在通过动作表达自身的方式上都颇有才能。而且我们的机器人在动态、平衡性等方面都表现良好。我们发现,舞者与机器人的运动方式是有关联的,编舞的人会将他们统一起来,这与腿的数目无关。当没有动物或者人类行为的模板时,你就需要多动点脑筋了。

教机器人跳舞、做体操动作或跑酷这些经验对机器人的商业应用有什么启发吗?

我们认为,机器人在跳舞和跑酷中掌握的技能,如敏捷度、平衡性和感知能力,对于许多机器人应用而言是必需的。更重要的是,波士顿动力机器人一直试图在开发新技能与保持有趣之间找到交集,而这也是一种不错的方式。

一个很好的例子是,当你让机器人在几天时间内做这些动作时,你会对硬件的鲁棒性有更深的了解。Spot 机器人通过产品化流程变得非常鲁棒,几乎无需维护,它甚至可以跳一整天的舞。而其原因正是我们从之前那些或诡异或有趣的尝试中学到的经验教训。你必须踏入未知的领域,才能知道你不知道的事情。


人们很难通过观看视频看出这背后所花费的时间,以及它们能够在多大程度上代表机器人的真实能力。你可以谈谈吗?

我尝试从这个视频出发来回答你的问题,当然我们发布的所有视频都是同样的道理。我们努力做出一些什么,一旦做成,那么它也就成功了。对于 Atlas 来说,大部分机器人控制来自于之前的工作,例如学会跑酷使我们发现了一条使用模型预测控制器来控制机器人动态和平衡的路径。我们使用这些让机器人执行一组舞步,这些舞步是我们和舞者、编舞师一起离线设计的。我们花费了大量时间——好几个月去思考舞蹈、合成动作,以及模拟迭代。

舞蹈需要力量和速度,我们甚至为此升级了 Atlas 的硬件,以给它更多力量。舞蹈可能是我们目前尝试过的最需要力量的活动,尽管跑酷看起来更有爆发力,但舞蹈所需的运动量和速度非常惊人。我们同样花费了大量时间,使机器具备算法的能力。

最终的视频我们只拍了两天,大部分时间用在了如何移动摄像机在充斥多个机器人的现场捕捉一个连续两分钟的镜头。当我们跑着拍摄这段齐舞多次之后,我们可以相当靠谱地重复它。在最终的两分钟段落里,不存在任何剪辑。

当然硬件还是存在问题的,它们需要维护,机器人有时候会跌倒。这些行为不会被产品化,也不是 100% 可靠,但它们是可重复的。我们诚实地展示了机器人能做的事情,我认为当你声称自己实现一件事时,诚实是必要的,这对我们来说很重要。

你刚才提到 Spot 现在已经足够鲁棒,可以跳一整天舞。那么 Atlas 呢?不停换电池的话,Atlas 也能跳一整天吗?

世界上仅有为数不多的 Atlas 机器人,它们很复杂,可靠性并非其主要关注点。我们会让 Atlas 时不时地休息一下,但其硬件的鲁棒性确实不错。如果没有鲁棒性,这个视频压根就无法拍摄。我认为 Atlas 有点类似直升机,其维护时间和使用时间的比率较高。而 Spot 更像汽车,你可以驾驶很长时间再休整。

你在教 Atlas 执行新的任务时,会用到机器学习吗?如果没有的话,为什么?

作为一家企业,我们已经探索了非常多的事情,但 Atlas 目前并未使用学习控制器。我希望未来有一天会实现。Atlas 目前的舞蹈表演使用了反射控制(reflexive control)和模型预测控制,其中前者结合了对力的反应、在线和离线轨迹优化。我们利用这些技术的原因在于,它们是使机器人解锁高性能行为的可靠方式,我们了解如何熟练运用这些工具,而且在这方面我们尚未走到尽头。

我们计划利用机器学习在已有的软硬件基础上进行扩展,但我认为波士顿动力和整个社区仍在尝试找出这些工具的用武之地。大家将在我们的自然演进过程中看到这些。


目前,Atlas 的动作主要是下半身发力,但跑酷也要用到上肢力量。我们最近看到了一些概念图,显示 Atlas 在做 vaults(以手支撑的跃过)、pullups(引体向上)等动作,可以谈一下这方面的进展吗?

人类和动物可以用腿做出很多了不起的动作,但如果全身都用上会更加惊艳。我认为跑酷提供了一个奇妙的框架,可以让我们朝着全身运动的方向不断迈进。走和跑只是一个开始,我们通过跳跃、旋转等更加复杂的动态行为来打磨技术,这也是过去几年我们一直在做的事情。我们的下一步是探索如何使用手臂来推或拉,提高这方面的敏捷性。

我给 Atlas 团队分配的任务之一就是让他们尽可能利用手臂,就像我们利用双腿一样频繁,以此来扩展 Atals 的移动性。我对未来几年的工作感到非常兴奋,因为我们将有机会借助 Atlas 做更多激动人心的事情。

你如何看待液压和电动驱动器?

我认为这不是一个二选一的问题。使用哪种驱动器取决于机器人的大小、用途、工作环境等因素。最终,两种驱动器技术都掌握会比较好。我们也使用这两种驱动器做出了令人印象深刻的动态机器人。

我认为,液压和电动驱动器的区别可能主要体现在规模上。制造小型液压机器非常具有挑战性,因为业内很少有人这么做。同样地,也很少有人制造大型电动机器。因此,你会发现这是两种技术之间的自然分界线。

除了波士顿动力的工作之外,还有哪些近期的机器人研究让你感到非常兴奋?

作为一家公司,我们喜欢追踪感知、计算机视觉、地形感知方面的科研进展。这些领域进展越大,我们的机器人能做的事情就越多。就我个人而言,我喜欢追踪操纵方面的研究,尤其是那些增进我们对基于摩擦的复杂交互的理解的研究,比如滑、推或移动绳子等柔性物体。

我们看到,机器人的操纵正在由简单的捏、举、投掷转向与环境进行更有意义的交互。我认为,这类操纵方向的研究将解锁移动操纵机器人的潜能,丰富机器人与世界的沟通方式。

除了前面提到的那些,波士顿动力是否还希望通过这个视频传递一些其他信息?

就我个人而言,由于我常年埋头机器人领域,对机器人是什么、能做什么、不能做什么都有比较深刻的了解,因此我强烈希望更多人可以花时间去接触机器人。很多人看了我们的视频之后会分享自己的看法,如果更多的人有机会去思考、学习、接触机器人,他们所达到的理解高度将催生更多新的想法,帮助我们思考机器人在日常生活中还有哪些用途。我认为这种可能性非常令人兴奋,我想看到更多人踏上这段旅程。

扩展阅读:《虽然再次被卖,但「波士顿动力还是波士顿动力」 

原文链接:https://spectrum.ieee.org/automaton/robotics/humanoids/how-boston-dynamics-taught-its-robots-to-dance

© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

登录查看更多
0

相关内容

机器人(英语:Robot)包括一切模拟人类行为或思想与模拟其他生物的机械(如机器狗,机器猫等)。狭义上对机器人的定义还有很多分类法及争议,有些电脑程序甚至也被称为机器人。在当代工业中,机器人指能自动运行任务的人造机器设备,用以取代或协助人类工作,一般会是机电设备,由计算机程序或是电子电路控制。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
《行为与认知机器人学》,241页pdf
专知会员服务
53+阅读 · 2021年4月11日
【斯坦福经典书】强化学习在金融应用,414页pdf
专知会员服务
122+阅读 · 2021年3月30日
【2020新书】构建机器学习应用:从想法到产品,42页pdf
专知会员服务
98+阅读 · 2020年12月1日
5G边缘计算的价值机遇
专知会员服务
64+阅读 · 2020年8月17日
【干货书】Python 编程,480页pdf
专知会员服务
235+阅读 · 2020年8月14日
德勤:2020技术趋势报告,120页pdf
专知会员服务
190+阅读 · 2020年3月31日
迪士尼CEO自述:我的10条管理原则(内含福利)
创业邦杂志
3+阅读 · 2020年5月16日
独家揭秘 | 波士顿动力SpotMini机器人自主导航技术
计算机视觉life
21+阅读 · 2018年5月15日
AI都干过什么让人细思极恐的事?
全球创新论坛
4+阅读 · 2017年9月15日
VIP会员
相关VIP内容
《行为与认知机器人学》,241页pdf
专知会员服务
53+阅读 · 2021年4月11日
【斯坦福经典书】强化学习在金融应用,414页pdf
专知会员服务
122+阅读 · 2021年3月30日
【2020新书】构建机器学习应用:从想法到产品,42页pdf
专知会员服务
98+阅读 · 2020年12月1日
5G边缘计算的价值机遇
专知会员服务
64+阅读 · 2020年8月17日
【干货书】Python 编程,480页pdf
专知会员服务
235+阅读 · 2020年8月14日
德勤:2020技术趋势报告,120页pdf
专知会员服务
190+阅读 · 2020年3月31日
Top
微信扫码咨询专知VIP会员