开源Llama 3.1发布：对端云AI的影响 - 专知VIP

会员服务 ·

23

Llama 3.1 · 开源大模型 ·

2024 年 7 月 31 日

开源Llama 3.1发布：对端云AI的影响

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

Llama 3.1发布，开源大模型王者易主。7月24日报道，美国科技巨头Meta推出迄今为止性能最强大的开源大模型——Llama 3.1 405B（4050亿参数），同时发布了全新升级的Llama 3.1 70B和8B模型版本；Meta评估了超150个基准数据集的性能，Llama 3.1 405B在代码生成和评估、数学推理、长上下文处理、工具使用和多语言支持等一系列任务中，可与GPT-4o、Claude 3.5 Sonnet和Gemini Ultra相媲美；在其他场景中，Llama 3.1 405B进行了与人工评估的比较，其总体表现优于GPT-4o和Claude 3.5 Sonnet。 • 开源引领，加速构建META生态。与闭源模型不同，Llama 3.1是公开可用的模型，模型的权重可供下载；Llama 3.1开源使得更广泛的开发者及社区可以为其应用程序定制模型，并在任何环境中运行，包括本地服务器、云端、笔记本电脑、甚至手机等，同时无需将数据分享给Meta。同时，Meta透露，其更新了许可证，允许开发人员首次使用包括405B参数规模的Llama模型的输出来改进其他模型。 • 未来预期：转向MOE结构，落地三种商业模式。MoE（混合专家模型）是一种基于Transformer架构的模型，旨在提高模型的计算效率和性能。其基本思想是通过多个“专家”网络（子模型）协同工作，根据输入数据的特征动态选择最合适的专家，从而优化计算资源的使用和模型的预测精度。基于Meta的商业模式，我们认为Llama 3.1在未来将有以下商业化落地模式： 1）云厂商使用费用：谷歌、亚马逊等下游云服务商提供基于Llama 3.1模型的服务，Meta将从中收取部分费用； 2）通过Meta生态间接变现：在Meta开发的Facebook、Instagram等软硬件产品上使用基于Llama 3.1模型的AI助手，从而吸引用户在软件内消费；3）广告服务：基于Llama 3.1模型提供广告开发以及精准投放服务，并收取费用。 • 风险提示：大模型研发进展不及预期，AI应用落地不及预期，AI算力投入不及预期。

成为VIP会员查看完整内容

38

相关内容

Llama 3.1

Text-to-Video的GPT-3时刻已来：OpenAI的SORA模型引领新技术突破

Text-to-Video的GPT-3时刻已来：OpenAI的SORA模型引领新技术突破

专知会员服务

53+阅读 · 2024年2月23日

AIGC行业深度报告：华为算力分拆：全球AI算力的第二极

AIGC行业深度报告：华为算力分拆：全球AI算力的第二极

专知会员服务

91+阅读 · 2023年10月10日

电子行业深度报告：边缘域AI的“寒武大爆发”

电子行业深度报告：边缘域AI的“寒武大爆发”

专知会员服务

48+阅读 · 2023年8月10日

大模型时代的AI十大趋势观察

大模型时代的AI十大趋势观察

专知会员服务

148+阅读 · 2023年7月13日

ChatGPT与AIGC深度报告：引领AI新浪潮，AIGC商业化启程

ChatGPT与AIGC深度报告：引领AI新浪潮，AIGC商业化启程

专知会员服务

186+阅读 · 2023年2月9日

最新《ChatGPT》报告，风口已至，商业化落地加速, 14页pdf

最新《ChatGPT》报告，风口已至，商业化落地加速, 14页pdf

专知会员服务

226+阅读 · 2023年2月5日

CMU赵鼎教授：可信赖智能的安全性与泛化性

CMU赵鼎教授：可信赖智能的安全性与泛化性

专知会员服务

25+阅读 · 2023年1月13日

JCIM｜药物发现中基于AI的蛋白质结构预测：影响和挑战

JCIM｜药物发现中基于AI的蛋白质结构预测：影响和挑战

专知会员服务

12+阅读 · 2022年6月26日

5G对全球经济的影响：中国报告

专知会员服务

31+阅读 · 2021年7月2日

谷歌推出量子机器学习框架TFQ-TensorFlow Quantum，一个可训练量子模型的机器学习框架

谷歌推出量子机器学习框架TFQ-TensorFlow Quantum，一个可训练量子模型的机器学习框架

专知会员服务

34+阅读 · 2020年3月10日

YOLOv5在建筑工地中安全帽佩戴检测的应用（已开源+数据集）

YOLOv5在建筑工地中安全帽佩戴检测的应用（已开源+数据集）

计算机视觉life

23+阅读 · 2020年11月10日

深度学习框架大PK：TNN决战MNN，ncnn依旧经典

深度学习框架大PK：TNN决战MNN，ncnn依旧经典

新智元

10+阅读 · 2020年7月3日

Gartner：2020年十大战略性技术趋势, 47页pdf

Gartner：2020年十大战略性技术趋势, 47页pdf

专知

25+阅读 · 2020年3月10日

与 TensorFlow 功能互补的腾讯 angel 发布 3.0 ：高效处理千亿级别模型

与 TensorFlow 功能互补的腾讯 angel 发布 3.0 ：高效处理千亿级别模型

AI科技评论

11+阅读 · 2019年8月28日

DeepMind网红博士300页论文出炉：面向NLP的神经迁移学习（附下载）

DeepMind网红博士300页论文出炉：面向NLP的神经迁移学习（附下载）

新智元

10+阅读 · 2019年3月27日

阿里云发布机器学习平台PAI v3.0

阿里云发布机器学习平台PAI v3.0

雷锋网

13+阅读 · 2019年3月22日

中文任务全面超越BERT：百度正式发布NLP预训练模型ERNIE

中文任务全面超越BERT：百度正式发布NLP预训练模型ERNIE

机器之心

11+阅读 · 2019年3月16日

AAA2019 Tutorial：可解释AI—人工智能的圣杯（160页PPT从理论到动机，应用和局限性）

AAA2019 Tutorial：可解释AI—人工智能的圣杯（160页PPT从理论到动机，应用和局限性）

专知

18+阅读 · 2019年1月28日

机器学习开放课程（终）：基于Facebook Prophet预测未来

机器学习开放课程（终）：基于Facebook Prophet预测未来

论智

11+阅读 · 2018年11月16日

深度文本匹配开源工具（MatchZoo）

深度文本匹配开源工具（MatchZoo）

机器学习研究会

10+阅读 · 2017年12月5日

基于负调查的云数据隐私保护关键问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

云计算环境下基于图模型的海量RDF数据管理关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

“非对称多通道”异质、异构内存系统架构及“启发式”混合内存资源管理机制的研究

国家自然科学基金

0+阅读 · 2015年12月31日

云端融合计算环境下QoS敏感的任务调度机制研究

国家自然科学基金

7+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

46+阅读 · 2015年12月31日

天气影响下基于损失厌恶的“公司+农户”型农产品供应链风险管理研究

国家自然科学基金

1+阅读 · 2015年12月31日

可证明的网络和数据匿名性及隐私增强身份管理关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

面向CCMANET网络可证明安全命名与名字路由机制关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于免疫的Rootkit隐遁攻击动态内存取证方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于Markov博弈的计算机网络对抗行动策略分析与建模研究

国家自然科学基金

17+阅读 · 2013年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

174+阅读 · 2023年4月20日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

223+阅读 · 2023年4月7日

One Small Step for Generative AI, One Giant Leap for AGI: A Complete Survey on ChatGPT in AIGC Era

Arxiv

49+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

152+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

63+阅读 · 2023年3月29日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

85+阅读 · 2023年3月21日

Data-centric Artificial Intelligence: A Survey

Arxiv

25+阅读 · 2023年3月17日

Deep learning in agriculture: A survey

Arxiv

11+阅读 · 2018年7月31日

VIP会员

相关主题

开源大模型

相关VIP内容

Text-to-Video的GPT-3时刻已来：OpenAI的SORA模型引领新技术突破

Text-to-Video的GPT-3时刻已来：OpenAI的SORA模型引领新技术突破

专知会员服务

53+阅读 · 2024年2月23日

AIGC行业深度报告：华为算力分拆：全球AI算力的第二极

AIGC行业深度报告：华为算力分拆：全球AI算力的第二极

专知会员服务

91+阅读 · 2023年10月10日

电子行业深度报告：边缘域AI的“寒武大爆发”

电子行业深度报告：边缘域AI的“寒武大爆发”

专知会员服务

48+阅读 · 2023年8月10日

大模型时代的AI十大趋势观察

大模型时代的AI十大趋势观察

专知会员服务

148+阅读 · 2023年7月13日

ChatGPT与AIGC深度报告：引领AI新浪潮，AIGC商业化启程

ChatGPT与AIGC深度报告：引领AI新浪潮，AIGC商业化启程

专知会员服务

186+阅读 · 2023年2月9日

最新《ChatGPT》报告，风口已至，商业化落地加速, 14页pdf

最新《ChatGPT》报告，风口已至，商业化落地加速, 14页pdf

专知会员服务

226+阅读 · 2023年2月5日

CMU赵鼎教授：可信赖智能的安全性与泛化性

CMU赵鼎教授：可信赖智能的安全性与泛化性

专知会员服务

25+阅读 · 2023年1月13日

JCIM｜药物发现中基于AI的蛋白质结构预测：影响和挑战

JCIM｜药物发现中基于AI的蛋白质结构预测：影响和挑战

专知会员服务

12+阅读 · 2022年6月26日

5G对全球经济的影响：中国报告

专知会员服务

31+阅读 · 2021年7月2日

谷歌推出量子机器学习框架TFQ-TensorFlow Quantum，一个可训练量子模型的机器学习框架

谷歌推出量子机器学习框架TFQ-TensorFlow Quantum，一个可训练量子模型的机器学习框架

专知会员服务

34+阅读 · 2020年3月10日

热门VIP内容

开通专知VIP会员享更多权益服务

《俄乌战争中的无人系统：新的战争方式与新兴趋势——来自前线的印象》报告

《海上自主水面船舶远程操作中心：安全可持续运行的多维度分析》

多模态大语言模型下游调优中“保持自我”的重要性

隐身自主无人水下航行器技术如何变革水下作战并重塑海军竞争

相关资讯

YOLOv5在建筑工地中安全帽佩戴检测的应用（已开源+数据集）

YOLOv5在建筑工地中安全帽佩戴检测的应用（已开源+数据集）

计算机视觉life

23+阅读 · 2020年11月10日

深度学习框架大PK：TNN决战MNN，ncnn依旧经典

深度学习框架大PK：TNN决战MNN，ncnn依旧经典

新智元

10+阅读 · 2020年7月3日

Gartner：2020年十大战略性技术趋势, 47页pdf

Gartner：2020年十大战略性技术趋势, 47页pdf

专知

25+阅读 · 2020年3月10日

与 TensorFlow 功能互补的腾讯 angel 发布 3.0 ：高效处理千亿级别模型

与 TensorFlow 功能互补的腾讯 angel 发布 3.0 ：高效处理千亿级别模型

AI科技评论

11+阅读 · 2019年8月28日

DeepMind网红博士300页论文出炉：面向NLP的神经迁移学习（附下载）

DeepMind网红博士300页论文出炉：面向NLP的神经迁移学习（附下载）

新智元

10+阅读 · 2019年3月27日

阿里云发布机器学习平台PAI v3.0

阿里云发布机器学习平台PAI v3.0

雷锋网

13+阅读 · 2019年3月22日

中文任务全面超越BERT：百度正式发布NLP预训练模型ERNIE

中文任务全面超越BERT：百度正式发布NLP预训练模型ERNIE

机器之心

11+阅读 · 2019年3月16日

AAA2019 Tutorial：可解释AI—人工智能的圣杯（160页PPT从理论到动机，应用和局限性）

AAA2019 Tutorial：可解释AI—人工智能的圣杯（160页PPT从理论到动机，应用和局限性）

专知

18+阅读 · 2019年1月28日

机器学习开放课程（终）：基于Facebook Prophet预测未来

机器学习开放课程（终）：基于Facebook Prophet预测未来

论智

11+阅读 · 2018年11月16日

深度文本匹配开源工具（MatchZoo）

深度文本匹配开源工具（MatchZoo）

机器学习研究会

10+阅读 · 2017年12月5日

相关基金

基于负调查的云数据隐私保护关键问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

云计算环境下基于图模型的海量RDF数据管理关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

“非对称多通道”异质、异构内存系统架构及“启发式”混合内存资源管理机制的研究

国家自然科学基金

0+阅读 · 2015年12月31日

云端融合计算环境下QoS敏感的任务调度机制研究

国家自然科学基金

7+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

46+阅读 · 2015年12月31日

天气影响下基于损失厌恶的“公司+农户”型农产品供应链风险管理研究

国家自然科学基金

1+阅读 · 2015年12月31日

可证明的网络和数据匿名性及隐私增强身份管理关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

面向CCMANET网络可证明安全命名与名字路由机制关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于免疫的Rootkit隐遁攻击动态内存取证方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于Markov博弈的计算机网络对抗行动策略分析与建模研究

国家自然科学基金

17+阅读 · 2013年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

174+阅读 · 2023年4月20日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

223+阅读 · 2023年4月7日

One Small Step for Generative AI, One Giant Leap for AGI: A Complete Survey on ChatGPT in AIGC Era

Arxiv

49+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

152+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

63+阅读 · 2023年3月29日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

85+阅读 · 2023年3月21日

Data-centric Artificial Intelligence: A Survey

Arxiv

25+阅读 · 2023年3月17日

Deep learning in agriculture: A survey

Arxiv

11+阅读 · 2018年7月31日

微信扫码咨询专知VIP会员