Llama 3.1发布,开源大模型王者易主。7月24日报道,美国科技巨头Meta推出迄今为止性能最强大的开源大模型——Llama 3.1 405B(4050亿参数),同时发布了全新升级的Llama 3.1 70B和8B模型版本;Meta评估了超150个基准数据集的性能,Llama 3.1 405B在代码生成和评估、数学推理、长上下文处理、工具使用和多语言支持等一系列任务中,可与GPT-4o、Claude 3.5 Sonnet和Gemini Ultra相媲美;在其他场景中,Llama 3.1 405B进行了与人工评估的比较,其总体表现优于GPT-4o和Claude 3.5 Sonnet。 • 开源引领,加速构建META生态。与闭源模型不同,Llama 3.1是公开可用的模型,模型的权重可供下载;Llama 3.1开源使得更广泛的开发者及社区可以为其应用程序定制模型,并在任何环境中运行,包括本地服务器、云端、笔记本电脑、甚至手机等,同时无需将数据分享给Meta。同时,Meta透露,其更新了许可证,允许开发人员首次使用包括405B参数规模的Llama模型的输出来改进其他模型。 • 未来预期:转向MOE结构,落地三种商业模式。MoE(混合专家模型)是一种基于Transformer架构的模型,旨在提高模型的计算效率和性能。其基本思想是通过多个“专家”网络(子模型)协同工作,根据输入数据的特征动态选择最合适的专家,从而优化计算资源的使用和模型的预测精度。基于Meta的商业模式,我们认为Llama 3.1在未来将有以下商业化落地模式: 1)云厂商使用费用:谷歌、亚马逊等下游云服务商提供基于Llama 3.1模型的服务,Meta将从中收取部分费用; 2)通过Meta生态间接变现:在Meta开发的Facebook、Instagram等软硬件产品上使用基于Llama 3.1模型的AI助手,从而吸引用户在软件内消费;3)广告服务:基于Llama 3.1模型提供广告开发以及精准投放服务,并收取费用。 • 风险提示:大模型研发进展不及预期,AI应用落地不及预期,AI算力投入不及预期。