为了更好地普及和传播大模型技术的最新进展与技术体系,我们于2024年12月出版了《大语言模型》中文书籍。作为该领域全面解析大模型技术的中文著作,该书将提供有关大模型技术的详细中文参考资料,注重为大模型技术的入门读者提供讲解,力图展现一个整体的大模型技术框架和路线图。本书由中国人民大学师生联手打造,由赵鑫教授和文继荣教授领衔,博士生李军毅、周昆和硕士唐天一参与编著,作者团队在大模型领域有着丰富的研究与开发经验,曾主导研发了文澜、玉兰等大模型。
考虑到课程教学及传播大模型知识的需要,《大语言模型》编写团队在书籍出版后特别制作了相应的PDF课件并正式上线。该课件内容除了涵盖中文书中的知识点,还增加了许多最新的研究进展,包括针对Deepseek等最新大模型技术进行了专门介绍。以下是课件大纲:
此外还包括评测与资源两个独立课件。 目前,PDF课件已上线中文书网站(https://llmbook-zh.github.io/),感兴趣的读者可前往网站自行下载。
我们对GPT和DeepSeek系列模型的发展历程做了详细的介绍。
我们对LLaMA、DeepSeek等模型的后训练流程做了详细解读。
我们还整理了近期非常流行的慢思考技术并做了详细介绍。
为了更好地支持大模型的授课普及工作,对于将本纸质书籍列为主要授课书籍的课程,如果需要相应的原始PPT课件进行授课,请使用本机构邮箱邮件联系 batmanfly at ruc.edu.cn 进行申请。