语言模型(LMs)已成为解决各种自然语言处理任务的关键技术,使其在人工智能研究和商业产品中无处不在。随着它们商业重要性的激增,最强大的模型变得愈加封闭,通过专有接口进行访问,关于它们的训练数据、架构和开发的详细信息未公开。鉴于这些细节在科学研究这些模型(包括其偏见和潜在风险)中的重要性,我们认为研究社区必须能够访问强大且真正开放的语言模型。在本教程中,我们提供了语言模型开发流水线的详细讲解,涵盖预训练数据、模型架构和训练、适应(如指令调优、强化学习与人类反馈 [RLHF])。在每个开发阶段中,我们都提供了使用开放软件和数据的示例,并讨论了我们在开发开放模型过程中的经验,包括技巧、窍门、陷阱以及其他通常无法访问的关于完整语言模型流水线的细节。由于我们需要涵盖这一主题的技术细节和示例,因此我们决定不提供可选的小组讨论。

成为VIP会员查看完整内容
5

相关内容

【WWW2024教程】大型语言模型驱动智能体,附slides
【RecSys 2023教程】大型语言模型推荐,101页ppt
专知会员服务
69+阅读 · 2023年11月12日
【KDD2023教程】用文本编辑模型的快速文本生成, 190页ppt
专知会员服务
26+阅读 · 2023年8月10日
【ACL2023教程】自然语言的复杂推理,240多页ppt
专知会员服务
54+阅读 · 2023年7月13日
【KDD2020】图神经网络生成式预训练
专知
22+阅读 · 2020年7月3日
国家自然科学基金
11+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
27+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2014年12月31日
Arxiv
158+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
408+阅读 · 2023年3月31日
Arxiv
148+阅读 · 2023年3月24日
Arxiv
21+阅读 · 2023年3月17日
Arxiv
68+阅读 · 2022年9月7日
VIP会员
相关基金
国家自然科学基金
11+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
27+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员