文|乔纳斯
2018 年,时间线上的迷人巧合
一个从AI聊天机器人起家的小冰,如今拥有了业界最为完备的AI being人工智能框架技术布局,已经孵化出财经主播“N小黑”、“N小白”、万科财务部虚拟员工崔筱盼、央美毕业的画家夏语冰等AI being。
回顾小冰的发展,2014 年,第一代小冰诞生,她从初始阶段只有文字的聊天对谈、到对答如流的语音交互,再到有了少女形象的二维动画,最终长成今天生动、丰满的虚拟形象;而“小冰”这个名词指代的,也从一个妙龄少女,扩展到可以对照无数人物(Human being)形象、角色、功能的“AI being”。
而在结束不久的2022北京冬奥会上,诞生于小冰框架的 AI being“观君”再次大放异彩。
在2月10日,自由式滑雪空中技巧混合团体赛中,徐梦桃、贾宗洋和齐广璞共同获得混合团体银牌;随后,在2月14日、16日,徐梦桃、齐广璞再次分获自由式滑雪空中技巧女子金牌和男子金牌。当沉甸甸的“两金一银”奖牌入账后,外界才知晓,由小冰研发的人工智能裁判与教练系统“观君”,已为国家队默默工作了三年多时间。
回顾小冰与中国自由式滑雪空中技巧队、国际雪联的合作源起,那些过往的时间线,露出了迷人的巧合之处。
2018 年平昌冬奥会,自由式滑雪空中技巧选手徐梦桃在决赛第二轮中失误,与奖牌擦肩而过的她,在回国后接受采访谈到,自己会平静一段时间,“需要理一理,再算一下数据。”
也是在 2018 年,自由式滑雪空中技巧国家队开启了新一轮的技术探索:要找到更优方案,提升国家队的训练效率。当年的冬奥会上,自由式滑雪空中技巧国家队在平昌获得一银一铜——这个成绩已经足够优秀,但为了“夺金”的梦想,国家队仍在寻找提升运动员成绩的黑科技。
还是在 2018 年,国际雪联走访了部分中国的科技公司,他们想要通过科技手段解决一个问题:包含空中技巧在内的主观评分项目,往往依靠裁判打分定胜负,这就与裁判的主观判断密不可分。如何让赛事判罚更加公正客观,是国际雪联一直以来的痛点。
三条不同的人、事、时间线,最终在一个人工智能团队上产生了交汇点,那就是“小冰”。
我们可以用最简单的语句描述三者与小冰的关系:从2018 年开始,空中技巧国家队、国际雪联与小冰陆续达成合作,由小冰公司研发人工智能裁判与教练系统“观君”,以辅助运动员、教练员进行日常训练、执教。最终,国家队在北京冬奥自由式滑雪空中技巧项目取得了2金1银的历史最佳成绩。
可现实的艰难与残酷,远不是只言片语就能轻易概括的。
如果你看过徐梦桃在今年北京冬奥的夺金瞬间,看到她身披国旗,对着漆黑的苍穹反复呐喊确认:“我是第一吗?我是第一吗?”你就能感受到,这当中的过程,不知道饱含了多少的艰涩、孤独与苦痛。
没人能预测未来。站上最高领奖台的徐梦桃不能,钻研人工智能技术近八载的小冰也不能,在 2018 年的节点上,徐梦桃与“小冰”面对的不确定性是一样的,她们能做的,只有为了一个坚定的目标,无休止地训练、拼搏……
“你们都可以考到裁判资格了”
让四年前的“小冰”成为空中技巧项目的AI裁判和教练系统,如今担任小冰公司首席运营官的徐元春对 36 氪回忆起当时接到任务时的想法坦承:“那会儿真没太大把握。”
徐元春在观看空中技巧运动员的表现,完全可以用“震撼”来形容当时的感受。而这种震撼,既来自这项运动本身的挑战与高危,也源于对运动员技术与勇气的敬佩,当然还有对人工智能技术能否在训练中发挥作用的思量。
2018 年,时下流行的人工智能场景,还是对着音箱利用唤醒词询问天气预报,或者通过人脸识别的摄像头判定性别和年龄,要让当时的小冰辅助备战冬奥的国家队,可谓难点重重。
“数据来源”就是一个棘手的问题。
想要训练出适配运动项目的人工智能模型,大量的数据学习必不可少,但“自由式滑雪空中技巧”项目由于难度大、训练周期长、场地特殊、且具备一定的危险性等原因,并不是多数普通人能参与到的运动项目,这就导致可以参照的样本较少。而数据积累不够,对后期的机器学习、模型优化都会造成阻碍。
“自由式滑雪空中技巧”的项目特性,更是让小冰团队犯了难。
首先,由于该项目速度快、起跳高、难度大,以动作识别为例,男子运动员出助滑坡时速超过70公里,高度差达15米,整套动作滞空时间仅2-3秒,最高难度的空中翻转加转体动作可达8圈,而这套过程需要被摄像头分毫不差地记录下来,才能让机器进一步分析运算。
更大的挑战,在于训练或比赛的现场环境,由于运动员穿的雪服具备防护及保暖功能,外观较为臃肿,服装颜色也容易与雪景或者天空重合,比起一般人物更难识别;再加上训练场地往往背景复杂(周遭有楼宇、树木、山石等干扰物),以及面临动辄零下二三十度的严寒,都会导致高帧率视频采集设备难以正常工作。
而最后一道关卡,则是要通过国家队的实践检验。
为了提升队伍成绩,队里的领导与教练经常会考察或试用各类前沿科技,对辅助科学训练的系统要求极高, 徐元春也记得,训练场景中,“高端的、物美价廉的、各种各样的设备队里见过也试过很多,但能把项目真正落地应用的,还比较少。”对小冰团队来说,这是考验,也是机遇。
“国家队的要求是真真正正地看到效果,而不是Fancy的(华丽的)用来演示的 Demo(样板)。”徐元春对 36 氪说。
重重困难下,要想打造一个“实时评分、量化动作、可追溯与预测”的系统,小冰团队面临巨大挑战。可一想到2022 年冬奥会在“自家门口”举办,抱着为奥运、为国家贡献一份力量的想法,小冰团队咬牙接下了这份工作:“当时觉得,这个梦想(让小冰成为 AI 教练/裁判)挺美好的,就是稍微有点遥远。”徐元春回忆起当时的想法。
准备工作旋即展开。2018年末,小冰团队的成员开始了跟随空中技巧国家队的“迁徙”,从 2019 年夏训、冬训、2020年新赛季、再到2021 年北京冬奥测试赛,国家队去哪里训练和比赛,小冰团队就在赛场旁边部署设备、架设网络、记录画面,如饥似渴地观摩比赛、提取数据……
饭要一口一口吃,问题也得一个一个解。
空中技巧项目带有一定的危险性,运动员每天的训练次数有限,因此用于机器学习的数据样本也相对有限。针对数据不够的问题,小冰团队实践了多种数据增强技术,根据空中技巧运动特征,探索出独有的数据增强方法,系统化模拟运动员的跳跃过程,生成符合运动规律,符合运动环境,符合实际场景的数据,以补充训练数据集,提高模型的泛化能力,使其能够在更多的场地,服务更多的运动员,从而弥补了数据量不足的问题。
针对运动员复杂的翻转动作,小冰自研了空中姿态识别算法,克服了大场景下复杂背景的干扰,并通过跟踪算法实现了高速运动目标的准确定位,最终完成项目全流程动作的精准判断,以确保运动员动作与姿态判别的准确性。
由于长期与国家队在一起训练,小冰团队对这项运动的流程、判罚等规则都变得捻熟于心——团队成员甚至达到了国际雪联认可的裁判水平。
他们可以熟练地列举出比赛中常见的扣分点:比如运动员出台是否有后仰,空中有没有屈膝、落地前倾是否过度、雪板有没有交叉等情况……项目组的成员几乎人人都对空中技巧项目做到了精通,在跟国际雪联的工作人员探讨裁判准则的时候,他们被评价为:“国际雪联的工作人员说,我们产品同事都能去拿个国际裁判证了。”徐元春回忆道。
冲破层层关卡,小冰打造的人工智能裁判与教练系统开始初具雏形。
让国家队验证价值的这一天终于到来。
“观君”的威力
徐元春清楚地记得一个时刻,那是 2019 年的夏天,在运动员训练的水池边上,小冰团队将这套系统的初版展示给队伍领导,对方看完演示,眼前一亮。
在这个版本中,系统不仅能够逐帧分析运动员的动作,识别出“屈膝、分腿、叉板”等可能存在的扣分点,还能立刻评判出每一跳的得分——相当于在日常训练中,给每位运动员都配备了专业裁判。本质上,这不只是一个记录画面的监控工具,更是一个可以分析运动表现的专业评判系统,如果能够投入使用,就意味着平常的训练场地,可以转变为拥有专业裁判的正式赛场,这对运动员来说将大幅提高训练效率。
在水池演示结束后,队领导围绕系统详细提问,又邀请了队伍中的资深教练深入考察,观摩了一圈,经过几轮讨论后,小冰团队觉得“有戏了”。
随着算法迭代与产品升级,在之后的训练中,该系统的价值愈发凸显。
对于运动员来说,每日训练最重要的部分,就是记住自己的正确动作,再通过日复一日的练习形成肌肉记忆,最终在赛场上稳定发挥。因此,掌握正确的运动姿态,就变得尤为重要。
数据在这时发挥出了威力。几乎每天训练后,运动员和教练都会来找“观君”查看当日的数据,分析动作哪里出了问题,是后仰过度还是屈膝了,再基于问题调整动作的精准度。
北京冬奥会上,自由式滑雪空中技巧国家队拿下“两金一银”的成果我们已然知晓,另一方面,在“AI 裁判”领域,系统在三年间完成近万次评分、五万多次动作分析,也成为了教练员日常执教的重要助手。
在2021年2月举行的北京冬奥测试赛中,“观君”还作为空技项目的唯一竞赛裁判,成功完成了个人预决赛、超级决赛、团体预决赛共44人次执裁,获得了国际雪联、国家体育总局冬运中心的一致认可,这也是人工智能系统在全球范围内首次独立完成大赛执裁任务。
不过,谈及系统的作用,徐元春却显得淡然,运动员取得好成绩更多还是依靠体育总局冬运中心和国家队自身对于科技的开放与拥抱,还有运动员坚持日复一日科学训练的回报,而小冰团队只是一边提供着人工智能裁判和教练系统的前沿科技,一边默默着陪伴在队伍身旁,遇到突发情况,会在“在零下二十度的时候爬上屋顶架设备、用电暖气烤热服务器”而已。
虚拟人的冰与火
在“观君”悄然发力的 2021 年,“虚拟人”行业的风口凶猛来袭。
据天眼查数据显示,中国现有“虚拟人”、“数字人”相关企业 28.8 万余家,2016-2020 年,五年新增注册企业增速复合增长率近 60%。
2021 年全年,虚拟数字人相关投资有 16 笔,融资金额从数百万元人民币到数千万美元不等,其中不乏红杉资本、GGV纪源资本、峰瑞资本等知名投资机构。2022 年,热钱继续涌入,开年第一个月,虚拟人领域近百起融资累计已超 4 亿元。
从大的行业逻辑来解释,在流量红利消失的当下,企业需要更具精细化的运营手段,以提高流量的转化,这就导致IP 形象的价值被凸显;而作为个体的人往往有种种不可控因素,特别是接连发生的“小鲜肉偶像塌房、李子柒与所属机构杭州微念闹掰、薇娅因逃税迅速坠落”等事件,更显示出“人类 IP ”的脆弱。
在这样的背景下,“虚拟人”稳定、生动、还有类似的情感属性,成了企业投射 IP 的新选择。
可眼下行业渐火,“虚拟人”行业也变得鱼龙混杂。
“虚拟人的火爆有一个很大的风险,就是概念不清。”小冰 CEO 李笛对 36 氪谈到,
放眼望去,市面上大部分火热的虚拟人形象,都集中在代言、虚拟偶像领域,这些形象虽然看上去惊无比吸睛,但无法与用户真情实感地交互,只是用来观赏的“纸片人”。
这也是“虚拟人”行业如今最大的误区,从功能上,单纯的“纸片人”只是没有灵魂的真人复刻,除了展示别无他用;再者,这种利用电脑合成“换头术”制作出的虚拟形象,在规模化和扩展性上,也存在巨大问题。
可以来算一笔账。
诸如抖音爆火的柳夜熙、江苏卫视元旦晚会上的“邓丽君”、英伟达CEO黄仁勋发布会上的替身,虽然都是“虚拟人”形象,但当中大量使用了CG(Computer Graphic,计算机图形学)渲染技术,当中花费的周期、成本,与制作一部好莱坞电影并无太差差异。
据 36 氪了解,制作一条几分钟的柳夜熙爆款短视频,制作成本接近百万;而要想复活明星打造一场全息虚拟演唱会,成本可以达到 2000 万元上下。
“虚拟人需要注意基于底层技术的综合成本。”李笛对此有着清晰的认知,“企业花几百万制作了一个虚拟代言人,他得到了什么?只有几十秒的视频和一些海报,这不太可能持续。”
让虚拟人规模化、低成本的产出,同时能具备“灵魂”、内外兼修,是小冰团队如今坚持的路线。
深厚的底层技术,是小冰如今敢于批量化生产“AI being”的关键。利用自研的 XNR(小冰深度神经网络渲染),小冰框架可以通过深度学习,在大量数据中提取特征,加速传统的渲染流程,同时在提升渲染速度的同时,让虚拟人的视觉形象、表情、肢体动作更加近似于真人。
以小冰与每日经济新闻打造的两个虚拟主播“N 小黑”、“N 小白”为例,在耗时上,通过小冰框架小样本学习技术,只需要一周的训练周期,两个数字孪生虚拟人就诞生了,成本也比传统 CG 渲染缩减了数十倍。
解决了成本与规模问题,小冰的另一条重要准则,是人工智能交互的“情商化”,在这一标准下,小冰旗下的 AI beings需要具备六大要素:
1、Persona,即基本性格特征,这需要通过小样本学习、算法模型来生成,而不同的AI being,个性也不尽相同;
2、Attitude,即态度,也包括观点,这种个性化的意见往往是多变的,尤其是在于用户的交互中,态度也会根据沟通语境发生变化;
3、Biological characteristics,即生物学特征,包括面容、声音等;
4、Creation,即创造力,比如绘画、作诗、唱歌,都是AI being创造力的体现;
5、Knowledge,即行业知识,比如“观君”需要具备雪上项目的知识、与万科合作的“崔筱盼”要具备财务知识;
6、Skill,即技能,这与上一项的Knowledge有区别,比如与每日经济新闻合作的主播“N小黑”,他具备金融和财经的知识,但如何像人类主播一样播报新闻,则是需要打磨的技能。
“这六个部分就是小冰 AI being的标准,你可以理解为是我们的DNA。”李笛对 36 氪说。
「孤勇者」小冰
随着北京冬奥以史上最优成绩落幕,默默耕耘了三年多的“观君”终于现身台前,再加上虚拟人行业渐火,小冰如今愈发受到关注。
回顾小冰的一路征程,李笛有些感慨:“我们孤独过好多回”。
鲜花和掌声太容易被看见。冬奥赛场上的运动员获得金牌;小冰从微软独立,拿下大笔融资成为“独角兽”,这些都是他们光鲜的那一面。可在赛场下、聚光灯外,运动员伤痕累累的躯体,小冰团队经历过的漠视、不被理解,都被他们藏进了欢笑背后的角落。
孤独是小冰的常态。回头看去,小冰在技术、产品形态、商业模式等模块上,几乎都曾与业内主流观点相左,这也让小冰承受了更大压力。
“我们做超级自然语音的时候,行业是不认可的,那时候的技术潮流是把文本念得清楚、标准,而不是念得自然;后来小冰又做了唱歌、写诗、绘画等创造行为,又被全网怼,大家不认可你为什么要让 AI 唱歌。”李笛对 36 氪说到。
可事实上,这些看似无关的闲聊、技能,实际上是小冰积累语料、训练数据的过程。也正因为在沟通交流中能与用户产生共情,小冰的多轮对话数量远超其他 AI 机器人。根据小冰去年公布的数据,其与用户的单次平均对话轮数(CPS)可以保持在36轮。
通过超级自然语音技术与多轮对话,小冰的“人格化”特点也在商业化中展现出优势。
小冰具备的情感属性可以影响人们的决策,这在电商、社交等场景颇为适用。拿小冰之前落地的罗森等零售案例来说,通过与用户的闲聊,小冰可以将用户模糊的购物需求一步步明确下来,最终为对方推荐出心仪的商品。
几番验证后,小冰的技术路线与其“闲聊”的产品模式,愈发成为行业关注的重点。越来越多的科技公司们发现,如果只是让用户与机器单纯围绕“开灯、听歌、识天气”来沟通,积累的语料数据永远无法让算法更智能。因此,如何与用户增加对话轮次、建立情感链接,成为当下“虚拟人”、乃至整个人工智能领域关心的话题。
在商业模式上,小冰也没有按照普通AI 公司做软硬一体、系统集成的方式,而是走出了一条独特路线。
随着小冰“虚拟人”项目的成熟,小冰的商业团队创造出一种全新的解决方案交付模式。徐元春曾对 36 氪介绍到,小冰“虚拟人”的商业模式不再是按照过去的解决方案订制化收费,而是按照 AI 能产出的劳动力和价值,以“人力”的逻辑去进行商业报价。
“小冰输出了一个实实在在的劳动力,那他每年能做多少工作,可以按照产出来付工资。”徐元春说到。
根据角色属性不同,小冰将旗下打造的 AI being划分为四种类型:
第一,AI Employee,虚拟员工。比如小冰与万科合作的财务员工“崔筱盼”、每经合作的“N小黑”和“N小白”、与日本罗森合作的虚拟店员等,她们不是冷冰冰的客服,而是会觉察情绪的真实个体。比如崔筱盼就能在工作流程和数据中发现问题,用更高效率完成各种应收/逾期提醒及工作异常侦测。
第二,AI Expert,是垂直领域的专家系统,能够深度掌握某一领域的知识并提供技能。典型案例就是前文提到的“观君”,李笛也告诉 36 氪,“观君”未来会应用到更广泛的体育领域,比如中小学体测考试等场景,成为真正帮助到大众的 AI 运动系统。
第三,AI Companion,指陪伴型“虚拟人”角色,类似小冰早期的“聊天机器人”形态,这将成为未来 AI to C(消费者)的一种重要模式。在日本,已经有很多老年人家庭需要陪伴 AI 虚拟人角色,用来陪聊、服务,还能解决老年人独居的安全问题。
第四,AI Entertainment,类似初音未来这样的虚拟偶像,不过,小冰不希望这类形象只是“纸片人”的角色,他们给虚拟偶像提了更高的标准:包括极其拟人的外形、声音;要有生产内容的能力;以及具备交互的能力。
目前,小冰的商业客户已覆盖金融、智能车机、零售、体育、地产等十多个垂直领域,知名客户还有中国外汇交易中心、香港证监会、万得资讯、国家体育总局冬运中心、中国联通、宝马、日产、蔚来、小鹏、万科集团等。从底层技术维度,据不完全统计,由小冰创建并承载的人工智能交互主体,拥有全球范围人工智能交互总流量约60%,超过亚马逊、谷歌及苹果同类产品的流量总和。
如今的小冰,已经从曾经孤独的“少女”,长成了穿过险境的勇者。而对于未来,李笛再次谈到了一个重要判断,那就是:数字化转型即将“AI being化”。
对于大型企业来说,数字化转型往往是企业寻求第二增长点的重要落脚。拿微软来说,之所以能在CEO 萨提亚上任后实现业绩飞速增长,最主要的原因是微软在全球范围内的数字化转型;而到今天,国内企业对数字化转型同样诉求满满,他们采购 CRM、搬上公有云、做起了私域流量,可很快,瓶颈又会出现。
“做了 SaaS、上了 RPA,等各个环节都覆盖了以后,企业会发现做到头了。”李笛对 36 氪说,而这个节点,就是将数字化转型“AI being化”的最佳时机。
拿万科的虚拟人员工“崔筱盼”为例,如果从工具视角来看,崔筱盼的作用,与一个金融催账场景的 RPA 工具并无太大差别,但因为“崔筱盼”的AI being属性,她能够模仿人类的情绪、口吻,从最开始发票与款项回收事项的提醒工作,未来逐步扩展到后来业务证照的上传与管理、提示员工社保公积金信息维护等。
有万科员工表示,崔筱盼回复邮件的速度很快,交流很有礼貌,可以很好地推动工作及时办理;他们私下还开玩笑,说崔筱盼是同事们的“女神”,性格好、能力强、还很漂亮。
这便是“AI being 化”后数字化转型的成果——要知道,崔筱盼催办的预付应收逾期单据核销率达到91.44%,为此,万科集团还将2021年万科总部最佳新人奖颁给了崔筱盼。
“我们认为AI being最重要的一件事,是他如果能像人一样控制对话走向,抛出新的话题,那么他的商业价值就和人一样,这就有很多新的商业机会。”李笛说到。