开、闭源模型共存满足不同开发需求,多模态有望催生现象级应用。大语言模型方面,闭源模型是模型基础能力上限持续突破的主阵地,同时通过开放API的方式实现能力延展。此外,开源与闭源模型差距缩小,并通过微调进一步助推应用生态繁荣。多模态方面,在头部AI公司及细分赛道领先者的共同推动下,图像、音视频生成等多模态愈发成熟。此外,集成文本、语音等混合多模态模型推出,变革人机交互方式,有望在强交互性场景中催生现象级应用。
海外文本编辑类应用表现亮眼,国内有望复制海外发展路径。从4月全球访问量前100网页版AI应用来看,可分为基于大语言模型的文本编辑类和代码编程类应用,以及基于多模态模型的图像类和音视频/游戏类应用,共四大类。其中文本编辑类因为基础模型能力技术较为成熟,因此应用最成熟:数量占比达58%,单月访问量过亿的8个应用中占7个。此外,现阶段海内外应用仍存在较大差距:海外前十AI应用单月访问量总和为55亿,而国内为1.2亿,头部产品ChatGPT单月访问量为18.6亿,国内Kimi为2004万。但从过去3个月来看,海内外前十应用的总访问量差距正逐步缩小。 模型能力决定应用体量的下限,场景适配度决定上限。文本编辑类:海外访问量最高的是聊天机器人,其次是搜索引擎。因模型能力与场景适配度高,虚拟角色和教育应用体量上限较高:前者因容错率高有望随模型能力提升实现线性增长,而后者因容错率低需要模型出现较大迭代后方能实现体量突破。图像类应用:多数应用集成了图像生成和编辑功能,未来有望通过加深与B端场景融合实现规模增长。音视频/游戏类:全球视频和游戏市场规模均超1万亿元,场景天花板高同时AI适配度高。但因受限于多模态模型能力,目前尚未有过亿的应用。未来在AI深度赋能行业创作工作流的同时,AI+UGC视频和UGC游戏将是C端现象级应用的重要方向。