创作门槛、内容质量,这两大门槛,或许AI能帮上大忙。
作者|咏霖
编辑|周峰
图源|腾讯
作为互联网的升级版,元宇宙和之前两个世代一样,将起跑线划在了社交上。
最著名的例子是春节期间冲上应用排行榜首便主动下架的“啫喱”。除此之外,百度“希壤”借助虚拟发布会亮相,但对自身的定位也是“元宇宙社交平台”。腾讯不久前推出的超级QQ秀被解读成“鹅厂”进入元宇宙的第一步。至于字节跳动的“派对岛”,名称本身就已经透露了一切。
当然,别忘了因为改名掀起元宇宙热潮的Meta,其前身Facebook的根基,同样是社交。
至少在由互联网传奇人物马克·安德森(Marc Andersson)和《创业维艰》作者本·霍洛维茨(Ben Horowitz)创办的硅谷风投机构A16Z的眼中,社交成为元宇宙的第一落脚点并不意外。
A16Z机构合伙人Jonathan Lai近日在一篇文章中认为,元宇宙的未来,最令人激动的,既不是其浩瀚无限的虚拟世界规模,也不是革新的先进基建,而是元宇宙将颠覆人类的社交方式。
Jonathan认为,等到元宇宙不断成熟,虚拟世界的规模和内容足够庞大,AI辅助能够足够强大之时,人类的社交方式将进一步演化。以“活动计划”为中心、目的性明确的社交方式将转向以“人”为中心的“自然社交”。
人类将不再像现在这样事先规划好社交活动、带有目的地进行社交,而是更随心所欲地畅游在元宇宙中,同朋友一道探索无穷无尽的虚拟世界体验。
作者通过YouTube类比元宇宙中人们的社交变化。今天,想上YouTube看视频,你可以完全不必事先计划好想看什么视频,而是打开YouTube,随心所欲地逛上一圈,看看有什么新鲜好玩的事,充分享受由其他用户生成的内容。同样地,在元宇宙中,我们可以不必计划好与谁相见、要做什么事情,而是可以随心所欲地走走瞧瞧,邂逅新的人或探索新的事。
为什么说随心所欲的模式将是未来?还是YouTube的例子。今天,美国青少年在YouTube上的时间(目的性不明确的看视频行为)已经远远大于在Netflix上看剧的时间(目的性更明确的看视频行为)。在国内,抖音、快手等短视频的崛起也已经大大攫取了用户原先定向浏览视频的时间。
但是,目前的元宇宙还远远不够成熟。元宇宙的内容总量还太少,不足以支撑“自然社交”的实现。
如何大幅增加元宇宙内容总量?
作者提出,内容生成方式具有四个发展阶段。
阶段1:专业人员生成内容,用户被动接受。体验较为单向。由于供给显著受限,这个阶段的内容总量是最少的。
阶段2:用户生成内容,形成小规模的多用户互动。这个阶段的内容总量有明显增加。
阶段3:AI辅助用户生成内容,形成大规模多用户互动。内容总量继续增加。
阶段4:完全由AI生成内容,在元宇宙实现超大规模、模拟现实世界的自然社交活动。
内容生成方式的四个发展阶段
来源:A16Z官网
作者认为,目前我们正处于阶段1到阶段2的过渡期。我们所接触的电视、电影、音乐、游戏等内容绝大部分都是由专业创作团队生成的。这类内容所打造的用户体验是单维度的,就算用户数量不断增长,用户体验都不会有显著变化。
我们熟悉的《魔兽世界》、《英雄联盟》等游戏的确实现了多用户交互,数百万玩家能够同台竞技,但这些游戏受制于服务器可承载量,在玩家社交体验方面的瓶颈非常明显。服务器可同时在线人数、单场游戏可容纳人数等等都是问题。而且,玩家在这些游戏中的社交目的由游戏开发者事先设定,非常明确,没有很好地模拟现实世界的社交方式。
目前“自然社交”在一些开放世界游戏中已初见端倪。例如“侠盗猎车手”(GTA)等开放世界游戏中,玩家可以随心所欲地探索开放世界,无需事先的任务计划。但这些游戏中的内容完全是由专业开发人员设计的,所以内容总量还非常有限。“侠盗猎车手”、“巫师3”这类游戏虽然创造了规模较为庞大的开放世界,可以让玩家自由探索,但由于游戏内容总是由专业游戏团队设计创建,开放世界的规模总是有限的,无法达到模拟现实世界社交活动所需的规模。
开放世界游戏“巫师3”
来源:Wccftech官网
作者认为,元宇宙“自然社交”所需的虚拟世界内容如果完全由专业团队来设计,从成本角度也无法实现。之前EA为了制作“星球大战:旧共和国”,仅在开发成本上就斥资2亿美元,雇了一支800人的游戏团队,耗时整整6年,才只能模拟出“星球大战”有限的部分虚拟世界。而搭建元宇宙可能需要“星球大战”数个星系那样巨大的虚拟世界规模。完全由专业团队来做,几乎不可能完成。
解决高质量内容的供给,将成为搭建元宇宙的最大挑战之一。
目前来看,用户生成内容似乎是不错的解决方案。首先在成本上,用户自发生成内容的成本微乎其微。其次,用户生成内容的规模可以非常庞大。YouTube上有3100万创作者,每天上传10亿小时的视频,比世界上任何专业工作室都要更高效,充分利用了庞大用户的无限创作能量。
但目前创作者占比还非常低。
作为具有生成内容能力的创作者,你必须先学会使用内容生成工具,学习一系列操作技巧,然后才能熟练生成内容。在YouTube上,虽然创作者有3100万,但每月用户量就有20亿,创作者占比仅1.2%。
做视频相对还比较简单。如果是做游戏内容,门槛要高得多。比如3D游戏常用的Unity和虚幻引擎功能强大,但对普通人而言上手难度很高。使用Unity的月活创作者数量大约是150万,而全球月活游戏玩家大约有27亿,对比非常明显。此外,如何保证用户生成内容的质量也是一大挑战。
未来趋势:AI辅助内容生成
受限于创作门槛、难以确保内容质量,这两大难题,或许AI能帮上大忙。
下一个努力的方向是迈向阶段3,也就是AI辅助用户生成内容。假如我们能在内容创作工具中合理地嵌入AI辅助,大幅降低写代码、绘图、动画等等操作的门槛,那么人人都有机会成为高水平创作者,创作者数量将大大增长。
目前文字处理方面,AI辅助工具的使用已经较为成熟了。例如,Roblox已经使用机器学习技术将游戏中的英文自动翻译成汉语、法语、日语等8国语言。
Naravoice是一家美国AI公司,能够将文本内容转换成自然人声阅读的音频,用户可以非常方便地快速发布音频内容。
Roblox利用机器学习翻译游戏内文本
来源:ROBLOX
而文本和音频的终点,将是图形开发。
由于图形的开发要复杂得多,AI辅助图形开发工具仍在探索中。
一方面,AI辅助图形开发的功能正在完善中。去年10月,英伟达发布了一款名为Maxine的智能视频会议平台,基于AI云端建模,优化视频会议的质量。除了常见的背景替换、降噪、面部追踪外,还有多项创新功能,包括面部对齐、照明调整、目光对准、实时翻译,并优化了运行所需网络带宽。
另一方面,如何利用AI进一步降低图形开发的门槛、提高创作者数量,也是一大难题。
去年3月,专注AI游戏解决方案的rct AI发布了野心勃勃的Morpheus Engine。官网介绍这一引擎非常强大,利用深度加强学习模型建立现实世界物体库,能够将文本内容直接转换成3D动画。例如输入“there is a man walking”(有个人在走路),就能够生成人走路的一段3D动画。
输入“there is a man walking”(有个人在走路)
就能够生成人走路的一段3D动画
来源:rct AI官网
许多创业者已经开始行动。国外有AI辅助视频剪辑工具Descript、AI视频生成工具Synthesia等等,国内AI辅助创作工具的融资也层出不穷。就在今年2月,全球化元宇宙社交平台BUD Technologies宣布获1500万美元融资,致力于让每个用户可以使用无代码工具创建个性化3D交互内容。此前,神奇代码岛BOX、代码乾坤等致力于用户3D内容生成的企业均获融资。
虽然目前还处于早期阶段,但随着AI模型不断完善,未来AI辅助工具将有望大幅提高用户图形内容生成的数量和质量。
AI+人类:创新的社交方式
AI+直播或将为用户带来新的社交方式。比如,Facebook近期发布了Rival Peak,这是一档类游戏互动真人秀节目,场景设置为12名AI参赛者的一场生存游戏,观众可以通过各个视角实时观察AI画面,通过投票进行交互,从而影响参赛者的实时行为。该节目每周7天每天24小时无间断实时直播。从节目效果来看,观众反应火爆。节目第六周结束后播放次数已经超过了2200万次。
AI将更加类人。目前几乎所有的游戏中,NPC和玩家的区别非常明显。未来,我们也许能在元宇宙中看到《西部世界》中那种能够生成自然语言、极度类人的NPC角色。
人们越来越感到孤独的今天,AI的存在或许能为人类填补社交需求,带来新的社交体验。尽管AI与人类的关系可能会牵扯到复杂的伦理问题,但对AI陪伴的需求却是真真切切,例如,今天已有超过700万人使用Replika聊天机器人来慰藉他们孤独的心灵。
未来,元宇宙庞大的虚拟世界以及高度智能化、情感化的AI将为人类带来媲美现实世界的“自然社交”体验。有趣的是,历史上,人类早期阶段的社交方式也是以偶然邂逅、目的性不明确的“自然”社交为主,而今虚拟世界发展的尽头,或许将使人类梦回历史之初。