deepseek模型密集更新,用户数将持续高速增长 自2024年起,DeepSeek在AI领域迅速掘起并不断选代。2024年12月底至2025年1月底,更新尤为密集,发布了参数众多且性能提升的V3、支持思维链输出和模型训练的R1,以及深耕图像领域的视觉和多模态模型。2024年12月底到2025年1月底,全球用户数从34.7万激增至1.19亿。与ChatGPT相比,DeepSeek仅用一年多就达到ChatGPT两年的用户规模,在国内1月跃居月均活跃用户数榜首,APP下载量也大幅增长。 Deepseek具备低成本、高性能、强推理三大特点 DeepSeek-V3通过算法创新和工程优化大幅提升模型效率,从而降低成本,提高性价比。DeepSeekV3训练成本仅为557万美元,耗时不到两个月。DeepSeek通用及推理模型成本相较于OpenA等同类模型大幅下降。DeepSeek-R1在继承了V3的创新架构的基础上,在后训练阶段大规模使用了强化学习技术,自动选择有价值的数据进行标注和训练,减少数据标注量和计算资源浪费,并在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,DeepSeek在AIME2024测评中上获得79.8%的pass@1得分,略微超过OpenAl-01;在MATH-500上,获得了97.3%的得分,与OpenAl-01性能相当,并且显著优于其他模型 DeepSeek驱动模型平价化,建议关注算力、AI应用和端侧的投资机会 1)算力:随着更多用户对DeepSeek的使用,以及未来更多AI应用的不断涌现,对算力的需求呈现出几何级增长超势。AI技术的进步,虽然模型效率提高了,但不断增长的用户和应用数量,却对算力资源提出了更高要求,消耗也随之剧增。2)B端应用:AlAgent正在对传统SaaS应用进行全面重构。与传统知识库结构化管理模式相比,AlAgent的向量数据库具备强大的自主学习能力,能够自动理解文档内容,实现更加高效的知识管理,为企业的数字化转型提供了有力支持。C端应用:作为生成式AI的重要商业化应用,AlAgent在电商、教育、旅游、酒店以及客服等多个行业得到了广泛应用。3)端侧:AI正在内容、应用、硬件、生态上影响世界,AlAgent从“数字”走向“具身”随着市场发展,大模型更广泛地接入硬件产品,做好软硬件协同发展是未来竞争的关键。