为什么特斯拉、戴森、追觅都在赌人形机器人?|焦点分析

2022 年 7 月 7 日 36氪
马斯克请回答。


文| 周倩、吴睿
编辑| 彭孝秋
来源| 36氪华南(ID: south_36kr)

封面来源|IC Photo

对人类来说,还有什么梦想会比成为造物主更终极?
人形机器人大抵就是这种梦想的最佳载体。因此当马斯克宣布Tesla Bot将改名为“擎天柱Optimus”时,才会搅动全球科技界的舆论,甚至带动了千里之外的中国机器人上市公司股价大涨。
按马斯克的说法,我们最早能在9月末的特斯拉AI Day上见到这个“迄今为止最像人的机器人”。从外形看,Optimus与人类相比已不差分毫:有躯干、头部和四肢,身高5英尺8英寸(约1.72m),体重125磅(约56.7kg),可负载20kg,行动速度最高可达8公里/小时;它还拥有“皮肤”——肩部以下由轻量材料覆盖,马斯克表示甚至比人的皮肤更光滑。
特斯拉人形机器人Optimus的核心参数

而除了特斯拉,以家电产品“出圈”的戴森也在做人形机器人,目前已发布的是一款能拿起漂白剂、夹起盘子的机械臂。戴森的愿景是,在未来10年内推出可以做家务的人形机器人。凭借在扫地机器人、吹风机和吸尘器等产品在家庭服务领域积累的经验和技术,打造下一个更高效替代人力的家电产品或许是戴森的逻辑。无独有偶,36氪获悉,从智能清洁品类突围的追觅科技,也有入局人形的规划。

来源:戴森

人类对于创造酷肖自己的机器的热情,从上世纪就从未熄灭。79年前西屋电气公司制造的“Televox”会走路、会说话,还会抽烟。此后,人形机器人一次又一次逼近人类的相貌外形、活动方式。从本田推出能跳跃和使用楼梯的ASIMO、到法国Aldebaran Robotics发布可以踢足球、跳舞、拳击的NAO,再到软银机器人公司发布能通过语音语调识别情绪的Pepper,再到波士顿动力逐年改进Atlas的运动流畅能力……

但除了引起一些「机器人会不会消灭人类」的杞人忧天外,人形机器人这些年在现实生活的落地并没往前走几步。以至于机器人界不断在争论一个问题:机器真的需要像人吗?

而狂人马斯克,显然用Optimus给了一个确定的「Yes」。

当机器像人一样运动

人形机器人是由什么组成的?

36氪曾观察过一款人形机器人的雏形:心脏是以高速马达为代表的电机,大脑是智能算法的处理系统;其他的重要技术栈包括关节(电机、减速器、驱控等)的设计与集成、人形整机的系统设计与稳定平衡控制,此外还包括三维环境的感知理解技术、结合感知的操控等。

很明显,除了让机器人看起来像人的部件外,更多技术栈指向的是运动能力。动起来像人,才是人形的灵魂。

Optimus在“动起来像人”的突破主要体现在眼睛和四肢运动能力上。沿用特斯拉在自动驾驶上的纯视觉路径,Optimus的“眼睛”也是摄像头而不是激光雷达,面部显示信息的屏幕内置FSD芯片,与汽车共用AI系统,在摄像头采集信息后,可以通过神经网络处理进行识别、预测和规划。

Optimus的身体由轻质材料组成,具有人类级别的双手双脚,四肢由全身搭载的40个机电执行器控制,双脚可通过力反馈感应系统来实现平稳和敏捷地行走,手臂和双手分别各依靠12个机电执行器,可以执行一些人类精细化的作业。

此外,Optimus还拥有强大的“大脑”:采用特斯拉的超级计算机系统Dojo,通过AI大数据进行神经网络训练。其核心是算力极强、带宽超高的“D1”芯片,通过Dojo接口处理器进行互连,25个芯片组成一个训练单元,算力可达9千万亿次。这是什么概念?人类大脑通过接近一千亿个神经元,平均算力接近5千万亿次。也就是说,一个训练单元就相当于两个成年人的算力,而目前Dojo组成的机柜集群包含120个训练单元。

Optimus的AI功能

马斯克曾放言:“特斯拉可以说是全球最大的机器人公司,因为我们的汽车就像轮子上的半感知机器人。”而Optimus确实证明了,在视觉和感知方面,特斯拉在车和人形机器人间的技术迁移是顺畅的。

但人形机器人和汽车毕竟有着本质区别,汽车用轮子向前滚,而人形要用关节来行走。追觅告诉36氪,人形机器人的研发最核心的就是人形整机的平衡控制——比如机器人在受外力等干扰时如何稳住自己——这需要研发人员在软件算法和机械设计的双重能力。

在平稳运动方面,四足机器人、人形机器人都曾经历过耗时不短的探索。2016年,波士顿动力的Atlas正式亮相,彼时外观已与现在无异。但当时的Atlas动作不连贯,甚至常常有摔倒的趋势,后来Atlas逐渐学会了保持身体平衡,以及协调各种动作,学会了后空翻、跳舞和跑酷等等,动作越来越接近人类。这个过程就用了数年时间。

波士顿动力Atlas最新运动表现

来源:波士顿动力

而如今机器人的运动能力究竟能达到怎样的流畅协调程度,或许还要看机器狗(也称仿生四足机器人)的运动水平。当前,机器狗的功能主要包括自主跑跳、在不规则不平整地形环境中运动,穿行突破障碍物等,机器狗产品在运动表现中的平衡性和稳定性,以及运动速度的一再提升突破是其区别于其他移动机器人的最重要特性之一。

尽管机器狗已经有了很稳定的运动能力,但再好的机器狗也只能替代宠物狗。从四足到两足,科技公司们依然有新的技术难关要突破。

人形的落地迷局

在马斯克的设想中,Optimus可以是工业机器人,也可以是家庭服务机器人。

他在TED演讲中说道,Optimus主要用于各类“危险、重复性或者无聊的工作” 以及那些人们不想做的工业生产工作。未来还会走进家庭之中,可以跑杂货店、捡拾家庭物品。

从现有的工业和家庭场景对于机器人的运用来看,人形进入这两个场景的那天还很遥远。目前,主流的工业机器人形态是AMR或复合机器人,本质而言,这些机器人都是对某个场景中某个动作的特定替代,比如移动、识别、抓取;家庭中常见的则是扫地机器人、陪伴机器人等,实现的功能也仅是针对某一具体的家庭活动需求。至于“全能”的、能够有效替代人力的人形机器人,既没有急迫的市场需求驱动,也还未出现完全匹配的适用场景。

事实上,人形机器人的落地一直都不顺利。之前想进入家庭场景的优必选,已于近年将重点转向To B业务。优必选创始人兼CEO周剑在去年的一次采访中谈到,“(人形机器人)要真正进入家庭服务,我觉得至少还需要5-10年,甚至更长的时间。”

国外的情况也大同小异。前文提到的“NAO”销量仅在万台左右,更多卖到高校,用于科研教学、比赛。在本田东京总部, Asimo也于日前正式宣布退役,结束了长达 22 年的表演服务生涯。最典型例子是波士顿动力,技术越进步,商业价值越不被看好。目前公司估值仅为11亿美元,刚够到独角兽的门槛,估值较6年前而言下降了66%。

但长期来看,此路虽漫长,人类已在人形机器人的迭代上往前迈了好几步。追觅方面对36氪表示,在结构化环境和相对简单的非结构化环境中,人形机器人当前已经具备了基础的行走运动、简单的操作作业能力。也就是说,在一些简单任务上,已经可以达到替代人力。

他们认为,乐观估计5年左右将会看到人形在展览演出、限定场景服务员等场景的落地。而在家庭服务场景中,追觅认为人形机器人会是目前很多家用产品的终极进阶版。这也是其研发这一形态的重要原因。

特斯拉在落地上的优势则是对汽车产业链的复用带来的价格优势。马斯克此前透露,其单价将“不会高得恐怖,或许会比一辆车的价格更低”。在财报电话会议上他也表示,如果未来两年内Optimus能够量产,在规模效应下,其成本比汽车还要低,相关业务规模,将比特斯拉汽车业务规模更大。

马斯克TED交流视频截图

国盛证券指出,考虑到特斯拉汽车在中国的售价最低为30万元左右, Optimus机器人的单体价格大体将位于17-30万元之间。这一价格区间相对波士顿动力机器人显著更低。波士顿动力在2020年首次发布用于商业的机器狗Spot,售价为7.45万美元/台,折合人民币50万元左右。

而Optimus能否真如马斯克所言的“行动自如”,在原型机出现之前,仅靠PPT和真人cosplay展示,恐怕还得打个问号。除了运动能力,与一众电子产品一样,机器人的电池续航、内部散热能力、结构稳定性、传感器技术表现等等,也要等Optimus真身出现或许才能回答。

对于人形机器人,人类总是既渴求也恐惧。它究竟会带人类走向西部世界的恐怖谷还是美丽新世界,或许还要几十、上百年才能有答案。但在我们这一代中,马斯克似乎是最可能带来有趣答案的那一个。9月,马斯克请回答。

(36氪作者周有辉对本文亦有贡献)

36氪旗下公众号

真诚推荐你关注



来个“分享、点赞、在看”👇
人形机器人
登录查看更多
1

相关内容

机器人(英语:Robot)包括一切模拟人类行为或思想与模拟其他生物的机械(如机器狗,机器猫等)。狭义上对机器人的定义还有很多分类法及争议,有些电脑程序甚至也被称为机器人。在当代工业中,机器人指能自动运行任务的人造机器设备,用以取代或协助人类工作,一般会是机电设备,由计算机程序或是电子电路控制。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
人形机器人行业深度研究报告
专知会员服务
64+阅读 · 2022年8月20日
2022中国工业机器人市场研究报告,61页ppt
专知会员服务
55+阅读 · 2022年7月24日
【硬核书】机器人中的大脑和认知智能控制,110页pdf
专知会员服务
65+阅读 · 2022年6月6日
1026页ppt!《智能电动车》投研大全
专知会员服务
41+阅读 · 2022年4月14日
企业如何探索元宇宙,如何驾驭炒作和现实?(附报告)
专知会员服务
97+阅读 · 2021年8月16日
专知会员服务
36+阅读 · 2021年5月21日
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
当我们谈智己时,我们在谈什么?
ZEALER订阅号
0+阅读 · 2022年4月19日
它将「救」松下,还是特斯拉?
36氪
0+阅读 · 2022年2月9日
请注意:这是真的机器人,不是合成动画
机器之心
0+阅读 · 2021年12月4日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年8月27日
Arxiv
11+阅读 · 2021年12月8日
A Multi-Objective Deep Reinforcement Learning Framework
VIP会员
相关VIP内容
人形机器人行业深度研究报告
专知会员服务
64+阅读 · 2022年8月20日
2022中国工业机器人市场研究报告,61页ppt
专知会员服务
55+阅读 · 2022年7月24日
【硬核书】机器人中的大脑和认知智能控制,110页pdf
专知会员服务
65+阅读 · 2022年6月6日
1026页ppt!《智能电动车》投研大全
专知会员服务
41+阅读 · 2022年4月14日
企业如何探索元宇宙,如何驾驭炒作和现实?(附报告)
专知会员服务
97+阅读 · 2021年8月16日
专知会员服务
36+阅读 · 2021年5月21日
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
相关基金
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员