Phi-4：微软最新的小型语言模型，专注于复杂推理 - 专知VIP

会员服务 ·

15

Phi-4 · 小型语言模型 · 复杂推理 ·

2024 年 12 月 14 日

Phi-4：微软最新的小型语言模型，专注于复杂推理

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

了解Phi-4：Phi家族最新的小型语言模型，提供高质量结果且模型尺寸小（14B参数）

Phi-4——一款14B参数的最新小型语言模型（SLM），它在复杂推理领域表现出色，尤其在数学推理方面，除了传统的语言处理任务外。Phi-4是我们Phi家族中的最新成员，展示了我们在不断探索小型语言模型（SLMs）边界时的技术进展。Phi-4目前可以在Azure AI Foundry上使用，并且在下周将通过微软研究许可协议（MSRLA）发布，之后将在Hugging Face上提供。

Phi-4基准测试

由于在各个过程中的创新进展，特别是在使用高质量合成数据集、高质量有机数据的筛选以及后期训练创新等方面，Phi-4在数学相关推理任务上超越了同类及更大规模的模型。Phi-4继续推动模型规模与质量之间的前沿发展。

Phi-4在数学问题上的表现，尤其是在数学竞赛问题上的基准测试

Phi-4在数学竞赛问题上的表现尤为出色，甚至超越了更大的模型，包括Gemini Pro 1.5（https://maa.org/student-programs/amc/）。要查看更多基准测试结果，请阅读我们在arXiv上发布的最新技术论文。

安全与负责任的AI创新

在微软，构建负责任的AI解决方案是AI开发的核心。我们已将强大的负责任AI能力提供给使用Phi系列模型的客户，包括专为Windows Copilot+ PC优化的Phi-3.5-mini。 Azure AI Foundry为用户提供了一套强大的能力，帮助组织在整个AI开发生命周期中衡量、缓解和管理AI风险，适用于传统机器学习和生成式AI应用程序。Azure AI评估在AI Foundry中使开发人员能够通过内置和自定义指标迭代地评估模型和应用程序的质量与安全性，以便做出相应的风险缓解措施。此外，Phi用户还可以使用Azure AI内容安全功能，如提示盾、受保护材料检测和真实性检测。这些功能可以作为内容过滤器，与我们模型目录中的任何语言模型一起使用，开发人员可以通过单一API轻松地将这些能力集成到他们的应用程序中。一旦投入生产，开发人员可以监控应用程序的质量和安全性、防御性提示攻击、以及数据完整性，并通过实时警报及时干预。

Phi-4的应用实例

Phi-4在数学推理方面的能力可以通过以下问题来展示：

成为VIP会员查看完整内容

25

相关内容

Phi-4

AI生成媒体检测综述：从非多模态大语言模型到多模态大语言模型

AI生成媒体检测综述：从非多模态大语言模型到多模态大语言模型

专知会员服务

17+阅读 · 2月11日

SFT 记忆，RL 泛化：基础模型后训练的比较研究

SFT 记忆，RL 泛化：基础模型后训练的比较研究

专知会员服务

24+阅读 · 2月3日

用于人工通用智能（AGI）的大型语言模型：基础原则和方法综述

用于人工通用智能（AGI）的大型语言模型：基础原则和方法综述

专知会员服务

28+阅读 · 1月7日

大规模语言模型增强推荐系统：分类、趋势、应用与未来

大规模语言模型增强推荐系统：分类、趋势、应用与未来

专知会员服务

38+阅读 · 2024年12月22日

《大语言模型推理加速》全面的硬件视角

《大语言模型推理加速》全面的硬件视角

专知会员服务

32+阅读 · 2024年10月12日

大语言模型安全开发者手册：构建安全的 AI 应用程序

大语言模型安全开发者手册：构建安全的 AI 应用程序

专知会员服务

33+阅读 · 2024年9月29日

大模型如何构建和部署？微软等最新《大型语言模型》综述，详述GPT, LLaMA, PaLM技术细节，Tomas等大牛撰写

大模型如何构建和部署？微软等最新《大型语言模型》综述，详述GPT, LLaMA, PaLM技术细节，Tomas等大牛撰写

专知会员服务

90+阅读 · 2024年2月12日

《大型语言模型》最新全面概述

《大型语言模型》最新全面概述

专知会员服务

109+阅读 · 2023年7月14日

中科大腾讯最新《多模态大型语言模型》综述，详述多模态指令微调、上下文学习、思维链和辅助视觉推理技术

中科大腾讯最新《多模态大型语言模型》综述，详述多模态指令微调、上下文学习、思维链和辅助视觉推理技术

专知会员服务

104+阅读 · 2023年6月27日

【干货书】PyTorch 深度学习，255页pdf

【干货书】PyTorch 深度学习，255页pdf

专知会员服务

278+阅读 · 2021年4月3日

【干货书】《Transformers 机器学习:深度探究》，284页pdf

【干货书】《Transformers 机器学习:深度探究》，284页pdf

专知

66+阅读 · 2022年4月21日

机器学习与组合优化如何结合？这份AAAI2021教程讲述「机器学习组合优化」进展，附240页ppt

机器学习与组合优化如何结合？这份AAAI2021教程讲述「机器学习组合优化」进展，附240页ppt

专知

23+阅读 · 2021年2月16日

深度学习的下一步：Transformer和注意力机制

深度学习的下一步：Transformer和注意力机制

云头条

56+阅读 · 2019年9月14日

【Github】nlp-tutorial：TensorFlow 和 PyTorch 实现各种NLP模型

【Github】nlp-tutorial：TensorFlow 和 PyTorch 实现各种NLP模型

AINLP

14+阅读 · 2019年9月4日

NLP命名实体识别开源实战教程 | 深度应用

NLP命名实体识别开源实战教程 | 深度应用

AI100

15+阅读 · 2019年8月18日

基于PyTorch/TorchText的自然语言处理库

基于PyTorch/TorchText的自然语言处理库

专知

28+阅读 · 2019年4月22日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

使用 Bert 预训练模型文本分类（内附源码）

使用 Bert 预训练模型文本分类（内附源码）

数据库开发

102+阅读 · 2019年3月12日

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

10+阅读 · 2019年2月18日

Caffe 深度学习框架上手教程

Caffe 深度学习框架上手教程

黑龙江大学自然语言处理实验室

14+阅读 · 2016年6月12日

核心化算法中的新技术研究

国家自然科学基金

8+阅读 · 2017年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

43+阅读 · 2015年12月31日

大规模模糊RDF数据管理关键技术研究

国家自然科学基金

7+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

8+阅读 · 2015年12月31日

随机文法作为通用统计模型的扩展

国家自然科学基金

1+阅读 · 2015年12月31日

Biot模型基于有限元离散的多重网格算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于结构学习的非平行支持向量机最优化方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

1+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

170+阅读 · 2023年4月20日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

210+阅读 · 2023年4月7日

One Small Step for Generative AI, One Giant Leap for AGI: A Complete Survey on ChatGPT in AIGC Era

Arxiv

49+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

464+阅读 · 2023年3月31日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

49+阅读 · 2023年3月22日

A survey and taxonomy of loss functions in machine learning

Arxiv

24+阅读 · 2023年1月13日

Identity-aware Graph Neural Networks

Identity-aware Graph Neural Networks

Arxiv

14+阅读 · 2021年1月25日

Few-shot acoustic event detection via meta-learning

Arxiv

26+阅读 · 2020年2月21日

Augmentation for small object detection

Augmentation for small object detection

Arxiv

11+阅读 · 2019年2月19日

VIP会员

相关主题

小型语言模型

相关VIP内容

AI生成媒体检测综述：从非多模态大语言模型到多模态大语言模型

AI生成媒体检测综述：从非多模态大语言模型到多模态大语言模型

专知会员服务

17+阅读 · 2月11日

SFT 记忆，RL 泛化：基础模型后训练的比较研究

SFT 记忆，RL 泛化：基础模型后训练的比较研究

专知会员服务

24+阅读 · 2月3日

用于人工通用智能（AGI）的大型语言模型：基础原则和方法综述

用于人工通用智能（AGI）的大型语言模型：基础原则和方法综述

专知会员服务

28+阅读 · 1月7日

大规模语言模型增强推荐系统：分类、趋势、应用与未来

大规模语言模型增强推荐系统：分类、趋势、应用与未来

专知会员服务

38+阅读 · 2024年12月22日

《大语言模型推理加速》全面的硬件视角

《大语言模型推理加速》全面的硬件视角

专知会员服务

32+阅读 · 2024年10月12日

大语言模型安全开发者手册：构建安全的 AI 应用程序

大语言模型安全开发者手册：构建安全的 AI 应用程序

专知会员服务

33+阅读 · 2024年9月29日

大模型如何构建和部署？微软等最新《大型语言模型》综述，详述GPT, LLaMA, PaLM技术细节，Tomas等大牛撰写

大模型如何构建和部署？微软等最新《大型语言模型》综述，详述GPT, LLaMA, PaLM技术细节，Tomas等大牛撰写

专知会员服务

90+阅读 · 2024年2月12日

《大型语言模型》最新全面概述

《大型语言模型》最新全面概述

专知会员服务

109+阅读 · 2023年7月14日

中科大腾讯最新《多模态大型语言模型》综述，详述多模态指令微调、上下文学习、思维链和辅助视觉推理技术

中科大腾讯最新《多模态大型语言模型》综述，详述多模态指令微调、上下文学习、思维链和辅助视觉推理技术

专知会员服务

104+阅读 · 2023年6月27日

【干货书】PyTorch 深度学习，255页pdf

【干货书】PyTorch 深度学习，255页pdf

专知会员服务

278+阅读 · 2021年4月3日

热门VIP内容

开通专知VIP会员享更多权益服务

中文资讯 | 洛克希德·马丁获美军10亿美元高超声速导弹合同

《欧盟及全球军用无人机系统：型号、性能与监管框架》最新报告

中文版3600字 | 人工智能对指挥控制系统的加速效应及其陆军实施启示

《复杂环境下的军事情报革新：运用复杂性科学与实战研究成果转型传统情报工作》最新322页

相关资讯

【干货书】《Transformers 机器学习:深度探究》，284页pdf

【干货书】《Transformers 机器学习:深度探究》，284页pdf

专知

66+阅读 · 2022年4月21日

机器学习与组合优化如何结合？这份AAAI2021教程讲述「机器学习组合优化」进展，附240页ppt

机器学习与组合优化如何结合？这份AAAI2021教程讲述「机器学习组合优化」进展，附240页ppt

专知

23+阅读 · 2021年2月16日

深度学习的下一步：Transformer和注意力机制

深度学习的下一步：Transformer和注意力机制

云头条

56+阅读 · 2019年9月14日

【Github】nlp-tutorial：TensorFlow 和 PyTorch 实现各种NLP模型

【Github】nlp-tutorial：TensorFlow 和 PyTorch 实现各种NLP模型

AINLP

14+阅读 · 2019年9月4日

NLP命名实体识别开源实战教程 | 深度应用

NLP命名实体识别开源实战教程 | 深度应用

AI100

15+阅读 · 2019年8月18日

基于PyTorch/TorchText的自然语言处理库

基于PyTorch/TorchText的自然语言处理库

专知

28+阅读 · 2019年4月22日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

使用 Bert 预训练模型文本分类（内附源码）

使用 Bert 预训练模型文本分类（内附源码）

数据库开发

102+阅读 · 2019年3月12日

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

10+阅读 · 2019年2月18日

Caffe 深度学习框架上手教程

Caffe 深度学习框架上手教程

黑龙江大学自然语言处理实验室

14+阅读 · 2016年6月12日

相关基金

核心化算法中的新技术研究

国家自然科学基金

8+阅读 · 2017年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

43+阅读 · 2015年12月31日

大规模模糊RDF数据管理关键技术研究

国家自然科学基金

7+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

8+阅读 · 2015年12月31日

随机文法作为通用统计模型的扩展

国家自然科学基金

1+阅读 · 2015年12月31日

Biot模型基于有限元离散的多重网格算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于结构学习的非平行支持向量机最优化方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

1+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

170+阅读 · 2023年4月20日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

210+阅读 · 2023年4月7日

One Small Step for Generative AI, One Giant Leap for AGI: A Complete Survey on ChatGPT in AIGC Era

Arxiv

49+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

464+阅读 · 2023年3月31日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

49+阅读 · 2023年3月22日

A survey and taxonomy of loss functions in machine learning

Arxiv

24+阅读 · 2023年1月13日

Identity-aware Graph Neural Networks

Identity-aware Graph Neural Networks

Arxiv

14+阅读 · 2021年1月25日

Few-shot acoustic event detection via meta-learning

Arxiv

26+阅读 · 2020年2月21日

Augmentation for small object detection

Augmentation for small object detection

Arxiv

11+阅读 · 2019年2月19日

微信扫码咨询专知VIP会员