生成式 AI 对搜索引擎是否存在威胁?
类似 ChatGPT 的生成式 AI 在搜索领域实现替代仍然面临诸多挑战,生成式 AI 技术需要先达到一定程度的 “规模优势(包括预训练数据集规模,用户反馈量)”之后才有机会威胁到搜索引擎的生存地位。这种“规模优势”既意味着模型可以解决问题的领域在数量上足够庞大,又意味着同一个领域中模型可交付出的解决路径数量最够庞大。
这种“规模效应”的达成有 2 个制约因素:1)用户习惯的颠覆。基于当前技术迭代路径的“搜索引擎(包括 Google,Baidu,和 Bing等)”已经教育了市场将近 25 年以上的时间,颠覆用户习惯需要极大的动能,这种动能一定是基于“替代方案”的效率要比“现存方案”优越数倍以上;2)生成式 AI 的模型进化的本质是依赖于对庞大的数据集的训练和微调,其背后的算力支撑是重要的技术驱动因素,而算力支撑取决于芯片技术(材料、设计、生产工艺)及“异构计算技术”的发展进程(包括计算开销的下降和计算交付结果精确程度的提高)。
生成式 AI 的算力需求
根据 Next Platform 对前期训练(不含微调)的估算, GPT-3 175B 的模型的每次训练成本在 875 万 – 1093.75 万美元之间,对应花费时间在 110.5 天-27.6 天,每 1 百万参数的训练价格是 50 美元-62.5美元之间。根据 Cerebras AI model studio 的 GPT-3 模型训练服务(基于 4-node CS-2 cluster)的报价信息, GPT 70B (700 亿参数,14000 亿 Tokens,85 天训练时间)的训练价格在 250 万美元每次。
生成式 AI 的商业化潜力
类似 ChatGPT 的生成式 AI,在不久的将来,生成式 AI 有较大可能在“智能客服”和“搜索引擎”进行增值,并有较大可能以“插件”的形式赋能现有的“生产力工具链(工程软件/音视频制作工具等)” 。
微软和谷歌共同和分别面临的挑战
无论对于微软还是谷歌而言,由于“生成式 AI”所带来的行业变革处于爆发的早期,行业的天花板较高,并且 AI 技术的上游硬件厂商也会微软等模型层和技术层厂商产生溢价,所以“赢者通吃”或“强者恒强”的局面并不会出现。
其共同面临的挑战包括: 1) 面临细分领域(电商,社交,游戏)的威胁或直接竞争,威胁包括细分领域数据集获得难度增大,竞争包括细分领域巨头直接下场竞争并更易于满足细分领域用户需求。2)算力开销驱动营业成本增加,生成式 AI 在发展早期的商业化绩效目标需要被理性的界定清楚。早期的发展,需要有持续的现金牛业务支撑AI明星业务的研发及运维开支,同时也要避免业务间存在内部不配合和摩擦。3)如全球通胀及供应链扰动持续,生成式AI模型层和应用层等下游环节厂商所创造的价值不断转移到上游的硬件或者能源厂商。比如,高端GPU/FPGA的厂商较为集中,而可替代品有限,上游厂商有较强溢价权。
微软面临的挑战包括:1)因为是引领GPT技术发展的领先企业,所以在面临政府或公益组织对其生成式AI生产内容的法律及道德问题时也是首当其冲;2)在智能手机操作系统、娱乐、文化、快消、电商等领域的数据积累有限,在这些领域进行模型训练的学习曲线依然很陡峭;3)如果微软同时掌握了用户接入操作系统,办公软件,和生成式AI搜索引擎的入口,则将需要面临更多“反垄断”相关的问题。
谷歌面临的挑战包括:1)对话式AI的搜索方式如果走向普及,将威胁现有的点击付费的广告商业模式;2)对现有的搜索引擎技术有一定路径依赖,模型过于庞大和复杂,将生成式AI技术整合入搜索引擎需要更长时间的试错;3)缺少先发优势,OpenAI和微软合作更早更深远,而谷歌一直缺少对生成式AI技术落地的验证(Bard并未达到预期)。