【摘要】大语言模型在自然语言处理领域取得了显著成就。 然而,由于其高昂的成本和资源消耗,其商业化应用仍处于早期 阶段。相比之下,小语言模型凭借较低的训练成本和较小的计算 资源需求等优势,展现出很大的潜力。本研究通过分析国内外小 模型的发展现状与具体案例探讨了小模型的应用潜力与面临的 挑战。研究发现:(1)小模型体型虽小但功能强大,具有成本优 势;(2)我国小模型在专业领域中的表现能够超越国外通用模型, 同时综合能力大幅提升,具有技术创新性;(3)由于大模型对算力资源的高需求,我国在资源与技术受限的情况下发展小模型, 能够助力我国在全球 AI 竞赛中脱颖而出。本文为我国 AI 行业发 展提供了战略方向。

成为VIP会员查看完整内容
3

相关内容

大语言模型的知识冲突:成因、根源与展望
专知会员服务
20+阅读 · 2024年9月23日
大型语言模型的景观:范式与微调策略的全面综述和分析
融合知识图谱的预训练模型研究综述
专知会员服务
47+阅读 · 2024年3月31日
小样本困境下的图像语义分割综述
专知会员服务
30+阅读 · 2023年1月24日
专知会员服务
31+阅读 · 2021年5月8日
专知会员服务
61+阅读 · 2021年2月22日
专知会员服务
38+阅读 · 2020年12月14日
专知会员服务
184+阅读 · 2020年6月21日
「知识增强预训练语言模型」最新研究综述
专知
17+阅读 · 2022年11月18日
智能合约的形式化验证方法研究综述
专知
16+阅读 · 2021年5月8日
深度多模态表示学习综述论文,22页pdf
专知
31+阅读 · 2020年6月21日
【新书册】贝叶斯神经网络,41页pdf
专知
28+阅读 · 2020年6月3日
赛尔笔记 | 多模态信息抽取简述
专知
29+阅读 · 2020年4月12日
【工大SCIR笔记】多模态信息抽取简述
深度学习自然语言处理
19+阅读 · 2020年4月3日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Arxiv
165+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
433+阅读 · 2023年3月31日
Arxiv
73+阅读 · 2023年3月26日
Arxiv
157+阅读 · 2023年3月24日
Arxiv
22+阅读 · 2023年3月17日
VIP会员
相关VIP内容
大语言模型的知识冲突:成因、根源与展望
专知会员服务
20+阅读 · 2024年9月23日
大型语言模型的景观:范式与微调策略的全面综述和分析
融合知识图谱的预训练模型研究综述
专知会员服务
47+阅读 · 2024年3月31日
小样本困境下的图像语义分割综述
专知会员服务
30+阅读 · 2023年1月24日
专知会员服务
31+阅读 · 2021年5月8日
专知会员服务
61+阅读 · 2021年2月22日
专知会员服务
38+阅读 · 2020年12月14日
专知会员服务
184+阅读 · 2020年6月21日
相关基金
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员