【新书】大型语言模型：概念、技术与应用

大型语言模型：概念、技术与应用

本书旨在介绍大型语言模型（LLMs）的科学原理及其应用。您将了解驱动近年来人工智能（AI）一些革命性应用的共同脉络：从对话系统如ChatGPT或BARD，到机器翻译、摘要生成、问答系统等众多领域。这些创新应用的核心是一门强大且快速发展的学科——自然语言处理（NLP）。在过去60多年中，该领域的研究致力于让机器能够高效地理解和生成人类语言。这些技术进步的秘诀在于LLMs，其强大的能力在于捕捉复杂的语言模式并学习语言的上下文表示。这些LLMs是如何工作的？有哪些现有的模型及其评估方式？本书将帮助您解答这些问题及更多疑惑。通过一场技术性但易于理解的介绍： * 您将探索LLMs的奇妙世界，从基础到其最强大的应用。 * 您将学习如何使用一些LLMs构建自己的简单应用程序。 * 通过六个章节，将理论与实践相结合，并在Colab平台上进行Python练习，循序渐进地引导您掌握LLMs的秘密及其在NLP中的应用。

从深度神经网络和注意力机制，到BERT、GPT-4、LLaMA、Palm-2和Falcon等最相关的LLMs，本书将带您领略NLP领域最重要的成就。您不仅会学习评估这些模型能力的基准，还将掌握创建自己的NLP应用程序的技能。这本书对AI、数据科学及相关领域的专业人士、研究人员和学生将极具价值。 关于作者

约翰·阿特金森-阿布特里迪（John Atkinson-Abutridy），在苏格兰爱丁堡大学获得人工智能博士学位，现为智利圣地亚哥阿道夫·伊巴涅斯大学工程与科学学院的全职教授。多年来，他还在智利和其他国家的多所大学担任全职学术职位，并作为访问教授和研究员在欧洲（法国、英国）、美国（麻省理工学院、IBM T.J.沃森研究中心）及多个拉丁美洲大学的大学和研究中心任职。阿特金森-阿布特里迪博士的主要研究兴趣包括自然语言处理、文本分析、人工智能及仿生计算。他的学术生涯中，发表了近百篇科学论文，并著有两本书。近年来，他在国内外多个科研和技术项目中走在前沿，担任多家公司人工智能顾问，并创立了AI-Empowered公司。为了表彰他对计算机科学领域的重要贡献，阿特金森-阿布特里迪博士于2010年获得美国计算机协会（ACM）的高级会员奖。在其杰出成就中，他于2005年开发了全球首个基于网络的自然语言对话模型，是现今ChatGPT系统的前身之一。2023年，他发布了他所著书籍的第二版《文本分析：非结构化信息分析的科学与应用导论》（Taylor & Francis，美国），并被Book Authority组织评选为文本挖掘领域的最佳选择。