北京大学：2025年DeepSeek-R1/Kimi 1.5及类强推理模型开发解读报告｜附76页文件下载 - 专知VIP

会员服务 ·

3

DeepSeek-R1 · 推理模型 ·

北京大学：2025年DeepSeek-R1/Kimi 1.5及类强推理模型开发解读报告｜附76页文件下载

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

报告深入剖析了DeepSeek-R1系列及其相关强推理模型从研发历程、核心技术创新至未来展望的全方位信息。聚焦于强化学习（RL）在大语言模型推理领域的运用，报告详细探讨了DeepSeek-R1 Zero与DeepSeek-R1如何在不依赖监督微调（SFT）的前提下，采用纯粹的强化学习策略，实现推理能力的突破性提升。 **

**

成为VIP会员查看完整内容

5

相关内容

DeepSeek-R1

《混合专家模型推理优化技术综述》

《混合专家模型推理优化技术综述》

专知会员服务

42+阅读 · 2024年12月21日

从基础到突破的LLM微调终极指南：技术、研究、最佳实践、应用研究挑战与机遇的全面综述

从基础到突破的LLM微调终极指南：技术、研究、最佳实践、应用研究挑战与机遇的全面综述

专知会员服务

51+阅读 · 2024年11月17日

如何处理模态缺失？首篇《缺失模态的深度多模态学习》全面综述

如何处理模态缺失？首篇《缺失模态的深度多模态学习》全面综述

专知会员服务

27+阅读 · 2024年9月13日

模型即服务MaaS框架与应用研究报告（2024年），46页pdf

模型即服务MaaS框架与应用研究报告（2024年），46页pdf

专知会员服务

63+阅读 · 2024年6月9日

大模型如何可解释？帝国理工最新《大型语言模型的解释性》最新综述

大模型如何可解释？帝国理工最新《大型语言模型的解释性》最新综述

专知会员服务

76+阅读 · 2024年1月24日

中山大学&清华发布《自然语言生成》综述论文，36页pdf阐述20年NLG进展

中山大学&清华发布《自然语言生成》综述论文，36页pdf阐述20年NLG进展

专知会员服务

58+阅读 · 2021年12月27日

【中科院软件所陈波老师】基于深度学习的自然语言语义解析，101页ppt

【中科院软件所陈波老师】基于深度学习的自然语言语义解析，101页ppt

专知会员服务

57+阅读 · 2021年11月8日

【哈佛大学】最新《理解模型可解释性》综述报告，45页ppt

专知会员服务

77+阅读 · 2020年12月4日

【报告推荐 | HEC-Montreal唐建博士】图神经网络推理，附27页ppt

【报告推荐 | HEC-Montreal唐建博士】图神经网络推理，附27页ppt

专知会员服务

77+阅读 · 2019年11月13日

斯坦福&谷歌Jeff Dean最新Nature论文：医疗深度学习技术指南（29页综述）

斯坦福&谷歌Jeff Dean最新Nature论文：医疗深度学习技术指南（29页综述）

专知会员服务

63+阅读 · 2019年1月7日

【2022新书】深度学习归一化技术，117页pdf

【2022新书】深度学习归一化技术，117页pdf

专知

26+阅读 · 2022年11月25日

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

专知

43+阅读 · 2022年11月5日

【2022新书】Python数据分析第三版，579页pdf

【2022新书】Python数据分析第三版，579页pdf

专知

19+阅读 · 2022年8月31日

【经典书】概率图模型：原理与技术，1270页pdf

【经典书】概率图模型：原理与技术，1270页pdf

专知

23+阅读 · 2022年2月13日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知

57+阅读 · 2020年7月2日

深度学习自然语言处理概述，116页ppt，Jiří Materna

深度学习自然语言处理概述，116页ppt，Jiří Materna

专知

37+阅读 · 2020年3月10日

【牛津大学|DeepMind】论深度学习中的统计思维，附49页ppt

【牛津大学|DeepMind】论深度学习中的统计思维，附49页ppt

专知

14+阅读 · 2019年11月25日

ICCV 2019教程《面向计算机视觉的可解释机器学习》，附280页PPT下载

ICCV 2019教程《面向计算机视觉的可解释机器学习》，附280页PPT下载

专知

33+阅读 · 2019年11月1日

斯坦福CS236-深度生成模型2019-全套课程资料分享

斯坦福CS236-深度生成模型2019-全套课程资料分享

深度学习与NLP

20+阅读 · 2019年8月20日

基于聚合的社会化短文本信息处理与细粒度倾向性分析

国家自然科学基金

0+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

1+阅读 · 2015年12月31日

个性化特征大数据支持下的交互式进化计算及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

故障机理的不确定传播及系统故障自动推演建模方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

几何与随机分析及其应用交叉平台

国家自然科学基金

0+阅读 · 2014年12月31日

基于复杂网络的商务大数据聚类与关联应用研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于中智集的模糊多属性决策理论、方法与应用研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于模型驱动的并发建模语言Apla+设计及其可靠性研究

国家自然科学基金

3+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

165+阅读 · 2023年4月20日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

199+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

78+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

438+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

137+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

60+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

75+阅读 · 2023年3月26日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

46+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

22+阅读 · 2023年3月17日

Deep learning in agriculture: A survey

Arxiv

11+阅读 · 2018年7月31日

VIP会员

相关主题

相关VIP内容

《混合专家模型推理优化技术综述》

《混合专家模型推理优化技术综述》

专知会员服务

42+阅读 · 2024年12月21日

从基础到突破的LLM微调终极指南：技术、研究、最佳实践、应用研究挑战与机遇的全面综述

从基础到突破的LLM微调终极指南：技术、研究、最佳实践、应用研究挑战与机遇的全面综述

专知会员服务

51+阅读 · 2024年11月17日

如何处理模态缺失？首篇《缺失模态的深度多模态学习》全面综述

如何处理模态缺失？首篇《缺失模态的深度多模态学习》全面综述

专知会员服务

27+阅读 · 2024年9月13日

模型即服务MaaS框架与应用研究报告（2024年），46页pdf

模型即服务MaaS框架与应用研究报告（2024年），46页pdf

专知会员服务

63+阅读 · 2024年6月9日

大模型如何可解释？帝国理工最新《大型语言模型的解释性》最新综述

大模型如何可解释？帝国理工最新《大型语言模型的解释性》最新综述

专知会员服务

76+阅读 · 2024年1月24日

中山大学&清华发布《自然语言生成》综述论文，36页pdf阐述20年NLG进展

中山大学&清华发布《自然语言生成》综述论文，36页pdf阐述20年NLG进展

专知会员服务

58+阅读 · 2021年12月27日

【中科院软件所陈波老师】基于深度学习的自然语言语义解析，101页ppt

【中科院软件所陈波老师】基于深度学习的自然语言语义解析，101页ppt

专知会员服务

57+阅读 · 2021年11月8日

【哈佛大学】最新《理解模型可解释性》综述报告，45页ppt

专知会员服务

77+阅读 · 2020年12月4日

【报告推荐 | HEC-Montreal唐建博士】图神经网络推理，附27页ppt

【报告推荐 | HEC-Montreal唐建博士】图神经网络推理，附27页ppt

专知会员服务

77+阅读 · 2019年11月13日

斯坦福&谷歌Jeff Dean最新Nature论文：医疗深度学习技术指南（29页综述）

斯坦福&谷歌Jeff Dean最新Nature论文：医疗深度学习技术指南（29页综述）

专知会员服务

63+阅读 · 2019年1月7日

热门VIP内容

开通专知VIP会员享更多权益服务

北京大学：2025年DeepSeek-R1/Kimi 1.5及类强推理模型开发解读报告｜附76页文件下载

从自我进化视角出发，全面解析LLM的推理能力技术演进路径

【CVPR2025】GEN3C：基于3D信息的世界一致性视频生成与精确相机控制

【博士论文】利用图结构加速稀疏计算

相关资讯

【2022新书】深度学习归一化技术，117页pdf

【2022新书】深度学习归一化技术，117页pdf

专知

26+阅读 · 2022年11月25日

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

专知

43+阅读 · 2022年11月5日

【2022新书】Python数据分析第三版，579页pdf

【2022新书】Python数据分析第三版，579页pdf

专知

19+阅读 · 2022年8月31日

【经典书】概率图模型：原理与技术，1270页pdf

【经典书】概率图模型：原理与技术，1270页pdf

专知

23+阅读 · 2022年2月13日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知

57+阅读 · 2020年7月2日

深度学习自然语言处理概述，116页ppt，Jiří Materna

深度学习自然语言处理概述，116页ppt，Jiří Materna

专知

37+阅读 · 2020年3月10日

【牛津大学|DeepMind】论深度学习中的统计思维，附49页ppt

【牛津大学|DeepMind】论深度学习中的统计思维，附49页ppt

专知

14+阅读 · 2019年11月25日

ICCV 2019教程《面向计算机视觉的可解释机器学习》，附280页PPT下载

ICCV 2019教程《面向计算机视觉的可解释机器学习》，附280页PPT下载

专知

33+阅读 · 2019年11月1日

斯坦福CS236-深度生成模型2019-全套课程资料分享

斯坦福CS236-深度生成模型2019-全套课程资料分享

深度学习与NLP

20+阅读 · 2019年8月20日

相关基金

基于聚合的社会化短文本信息处理与细粒度倾向性分析

国家自然科学基金

0+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

1+阅读 · 2015年12月31日

个性化特征大数据支持下的交互式进化计算及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

故障机理的不确定传播及系统故障自动推演建模方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

几何与随机分析及其应用交叉平台

国家自然科学基金

0+阅读 · 2014年12月31日

基于复杂网络的商务大数据聚类与关联应用研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于中智集的模糊多属性决策理论、方法与应用研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于模型驱动的并发建模语言Apla+设计及其可靠性研究

国家自然科学基金

3+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

165+阅读 · 2023年4月20日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

199+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

78+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

438+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

137+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

60+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

75+阅读 · 2023年3月26日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

46+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

22+阅读 · 2023年3月17日

Deep learning in agriculture: A survey

Arxiv

11+阅读 · 2018年7月31日

微信扫码咨询专知VIP会员