2022年,效果惊人的Disco Diffusion、Midjourney、DALL·E2和Imagen AI,让大众切身体会到了AI在图像生成上的惊人表现。
而这只是AIGC(AI内容生成)的一个缩影。
除了图像,如今的AI在文本、音乐、视频、甚至策略生成上都有了显著的突破,相关成果不断出现。
量子位智库在此基础之上梳理了AIGC相关技术场景及成熟度分类:
我们认为,随着标注数据累积、技术架构完善、内容行业对丰富度/事实性/个性化的要求越来越高,AIGC行业即将被推向前台。
在未来2-3年间,AIGC的初创公司和商业落地案例将持续增加。
那么,国内目前有哪些AIGC相关机构值得关注?他们各自进展如何?
在国外,又有哪些高潜力场景与商业模式可供借鉴?
成立时间及融资轮次:
2020年
A轮(估值已达10亿美元独角兽,高瓴领投)
主营方向:
小冰是全球领先的人工智能科技公司,旗下小冰框架是全球承载交互量最大的完备人工智能框架之一,在开放域对话、多模态交互、超级自然语 音、神经网络渲染及内容生成领域居于全球领先。
AIGC相关亮点:
作为“AI being”派虚拟人。小冰的产品始终是人+交互+内容。具体包括虚拟人(夏语冰等somebody instance、虚拟男友等nobody instance和国家队人工智能裁判与教练系统观君等在垂直场景中工作的虚拟人类)、音频生成(主攻超级语言及歌声,在线歌曲生成平台与歌手 歌声合成软件X studio)、视觉创造(毕业作品集《或然世界》、为国家纺织品开发中心、万事利等数百家机构提供了图案和纹样设计)、文本创造(2017年即推出小冰诗集)、虚拟社交、Game AI(Xiaoice Game Studio)等。
商业客户已覆盖金融、智能车机、零售、体育、纺织、地产、文旅等十多个垂直领域,并提出了以“人力”的逻辑去进行商业报价的虚拟人商业模式。
成立时间及融资轮次:
2018年
A轮(TME领投,单轮融资数千万人民币)
主营方向:
公司致力于运用AI技术从作词、作曲、编曲、演唱、混音等方面全方位降低音乐创作及制作门槛,为音乐行业提供新的产品体验,提升效率。
AIGC相关亮点:
产品包括针对视频生成配乐的配乐猫、支持非音乐专业人员创作的口袋音乐、可AI生成歌词的 LYRICA、AI作曲软件LAZYCOMPOSER。目前已与国内多家音乐平台厂商达成合作。其音乐标注团队已形成了全球最精确的话语歌曲音乐信息库。
成立时间及融资轮次:
2019年
Pre-A轮(中文在线投资,单轮融资千万人民币级)
主营方向:
一家以技术为核心的创新型公司和无人驱动数字分身技术解决方案供应商,通过自研神经渲染引擎和TTSA技术,实现基于文本实时生成高质量语音(音频)和动画(视频)。
AIGC相关亮点:
倒映有声将其虚拟人的高自然度归结于神经渲染(Neural Rendering)、TTSA(基于文本和语音合成实时生成音频和视频)、ETTS(富情感语音合成)、Digital Twin。通过神经渲染技术快速构建AI数字分身,通过语音+图像生成技术,生成和驱动数字分身的唇形、表情、动作、肢体姿态,创造表情自然、动作流畅、语音充满情感的高拟真度数字分身IP。2021年3月倒映有声和中央广播电视总台音频客户端「云听」签署战略合作协议。
成立时间及融资轮次:
2018年
A3轮(元宇宙资本和Springwind Ventures领投,单轮融资额超千万美元)
主营方向:
rct AI致力于运用人工智能为游戏行业提供完整的解决方案,并利用人工智能生成内容(AIGC)创造真正的Metaverse。通过使用最前沿的技术,特别是深度学习和强化学习,rct AI为消费者和制作方提供真正动态且智能的用户体验。
AIGC相关亮点:
通过简单设计并调整不同的参数,rct AI的混沌球(Chaos Box)算法可以在游戏中大规模地轻松生成具有智能意识的虚拟角色。他们的行为和对话不会重复,皆为动态生成。在游戏场景中,部署具有不同性格的智能 NPC,通过对话、行为等动态交互,增加玩家的游戏时长,同时提供新的变现途径。具体包括性格化NPC、对抗式 AI、互动式AI、大规模智能 NPC 部署、智能留存及智能运营策略等。
目前,rct AI已凭借核心技术Chaos Box帮助了10余家企业,完成包括对战游戏、虚拟人铸造等多种类型的项目,与世界范围内 20+ 游戏厂商建立了深入合作,触达超过 2 亿用户。
成立时间及融资轮次:
2019年
B轮(红杉中国领投,估值已达10亿独角兽,单轮融资1亿美元)
主营方向:
超参数科技是一家专注于AI领域的科技公司,致力于「打造有生命的AI」,创造一个10亿人与100亿AI共同生活的虚拟世界。超参数围绕L1-L4技术路径打造极致的AI Bot,逐步为广泛用户带来全新的虚拟世界体验。
AIGC相关亮点:
超参数科技提供的AI bot支持玩家陪玩(3D生存游戏AI猎户座α)、多人团队竞技(球球大作战)、非完美信息博弈AI(斗地主、德扑、麻将等)等。自有游戏AI平台“Delta”采用全新的“AI+游戏”研发管线,为开发侧和体验侧两端带来范式创新。
目前,超参数AI Bot已在多款千万日活的产品中上线,每日在线数峰值将近百万,业内率先实现在3D FPS领域的大规模商业化落地。
成立时间及融资轮次:
2018年
D轮(单轮融资13.6亿元,商汤科技领投)
主营方向:
影谱科技以人工智能视觉技术产业化为主要目标,是国内领先的智能影像生产技术提供商及应用方案提供商。公司专注于视觉内容的生产效率与呈现交互方式的技术研究,通过ACM(影像商业化引擎)、AGC(影像工业化引擎)和ADT(数字孪生引擎)三大引擎,面向媒体、文化、科教等多行业领域提供一站式的智能解决方案。
AIGC相关亮点:
在视频生成相关领域支持结构化视觉分析、影像自动合成技术(将视频短片、图片、音轨等按照规定效果批量化自动拼接)、智能视频编辑(基于视频中多模态信息的特征融合进行学习,按照氛围、情绪等高级语义限定,对满足条件片段进行检测并合成)、视频内容生产(对视频中的镜头、元素和场景采用不同的生成方式,同时对组件的组合方式进行学习,实现视频的自动化生产)、行为动作分析、场景信息恢复、跨模态转换等。
AIGC相关亮点:
除去业内首个AI驱动的多模态虚拟人“艾灵”外,以“绝悟”为代表,腾讯AI Lab基于自己的多模态学习及生成能力在游戏领域进行了全流程的布局。
「绝悟」AI通过强化学习的方法来模仿真实玩家,包括发育、运营、协作等指标类别,以及每分钟手速、技能释放频率、命中率、击杀数等具体 参数,让AI更接近正式服玩家真实表现,将测试的总体准确性提升到95%。
目前腾讯绝悟在环境观测、图像信息处理、探索效率等方面的创新算法已经突破了可用英雄限制(英雄池数量从40增为100 ),让 AI 完全掌握 所有英雄的所有技能并达到职业电竞水平,能应对高达10的15次方的英雄组合数变化。
基于绝悟,王者荣耀的数值平衡性偏差已经从1.05%下降到0.68%,其所涉及的“多智能体”决策过程中,可以在高达 10 的 20000 次方种操作可能性的复杂环境中进行决策。
目前,腾讯AI Lab还与腾讯 AI Lab 还与王者荣耀联合推出了AI开放研究平台「开悟」,并积极举办相关赛事。
……
除此之外,其他相关机构还包括:微软亚洲研究院(可支持图像变为动态、文本生成视频、文本生成图像、图像补全、图像生成的NUWA-Infinity,可参考https://www.qbitai.com/2022/07/36275.html)、阿里巴巴(阿里巴巴智能设计实验室,如虚拟模特塔玑及AI视觉物料生成系统阿里鹿班)、百度(百度云虚拟人及中文作画AI文心·一格,可参考https://www.qbitai.com/2022/08/37097.html)、特赞(内容智能生成板块)。
1、Zyro :围绕垂直业务场景,结合业务knowhow 组织相关AIGC能力
围绕电商场景,通过AIGC生成网站搭建过程中所需的各类素材,具体业务包括针对性生成公司介绍、企业价值、Slogan、自动提升图片清晰度、自动生成logo等。
国内类似的公司包括聆心智能。基于多模态对话生成系统,该公司专注于针对精神心理的AI驱动的高质量数字疗法,让AI围绕认知、情绪和行为三个维度对用户进行评估和干预,生成千人千面的情绪治疗方案,目前已与北医六院、湘雅二院、中日友好医院、清华大学玉泉医院等达成合作。
2、NVIDIA:构建技术矩阵,使其最终服务于创作型工具平台
在视觉生成研究领域始终位于前沿,代表作品包括CycleGAN、GauGAN、EditGAN、GANverse3D、Instant NeRF等。
3、OpenAI:将其底层模型对外开放商用,开创基础设施型的商业模式
GPT-3目前已经开始对外提供API,并分为四种模型按照用量对外收费。
4、Gliacloud:拼凑式视频生成代表
输入文本链接,软件能够自动对其中的标题和文字进行区分表示,并根据不同层级自动匹配素材和文字的转场、格式等,进而形成说明式的视频。据公开数据,该方式能够增加10倍的视频产量。
类似公司包括:Gliacloud、Synths.video、lumen5、Pencil。
5、Rosebud.ai:可结合营销数据生成无版权纠纷的图像
Rosebud.ai能够生成非真实的人脸图像,并在该图像中匹配相关衣物等所需素材。此外,模型面孔可以根据对应受众的相关数据进行调整。该公司声称,其生成模型能够使活动点击率提升22%。
类似公司包括:Generated Photos。
6、Persado:结合精准用户画像,实现个性化文本营销
Persado的平台将营销创意分解为六个关键要素:叙事、情感、描述、号召性用语、格式和文字定位。通过组合各类元素,该平台能够为每位客户确定交流的个性化措辞。该平台已被多家公司用于促销电子邮件、社交媒体广告、 店内展示横幅甚至广播内容等,以提高品牌参与度和转化率。
类似公司还包括Anyword、Phrasee、Persado、Pencil、Copy.ai、 Friday.ai、Retresco、Writesonic、 Conversion.ai、 Snazzy AI、Rasa.io、LongShot.AI。
扫描二维码,即可下载量子位智库出品的完整版《AIGC/AI生成内容产业展望报告》:
也可扫描下方智库小助手微信,进入主题群进行讨论:
关于量子位智库:
量子位旗下科技创新产业链接平台。致力于提供前沿科技和技术创新领域产学研体系化研究。面向前沿AI&计算机、生物计算、量子技术及健康医疗等领域最新技术创新进展,提供系统化报告和认知。通过媒体、社群和线下活动,帮助决策者更早掌握创新风向。