大型语言模型:概念、技术与应用
本书旨在介绍大型语言模型(LLMs)的科学原理及其应用。您将了解驱动近年来人工智能(AI)一些革命性应用的共同脉络:从对话系统如ChatGPT或BARD,到机器翻译、摘要生成、问答系统等众多领域。 这些创新应用的核心是一门强大且快速发展的学科——自然语言处理(NLP)。在过去60多年中,该领域的研究致力于让机器能够高效地理解和生成人类语言。这些技术进步的秘诀在于LLMs,其强大的能力在于捕捉复杂的语言模式并学习语言的上下文表示。这些LLMs是如何工作的?有哪些现有的模型及其评估方式?本书将帮助您解答这些问题及更多疑惑。通过一场技术性但易于理解的介绍: * 您将探索LLMs的奇妙世界,从基础到其最强大的应用。 * 您将学习如何使用一些LLMs构建自己的简单应用程序。 * 通过六个章节,将理论与实践相结合,并在Colab平台上进行Python练习,循序渐进地引导您掌握LLMs的秘密及其在NLP中的应用。
从深度神经网络和注意力机制,到BERT、GPT-4、LLaMA、Palm-2和Falcon等最相关的LLMs,本书将带您领略NLP领域最重要的成就。您不仅会学习评估这些模型能力的基准,还将掌握创建自己的NLP应用程序的技能。这本书对AI、数据科学及相关领域的专业人士、研究人员和学生将极具价值。 关于作者
约翰·阿特金森-阿布特里迪(John Atkinson-Abutridy),在苏格兰爱丁堡大学获得人工智能博士学位,现为智利圣地亚哥阿道夫·伊巴涅斯大学工程与科学学院的全职教授。多年来,他还在智利和其他国家的多所大学担任全职学术职位,并作为访问教授和研究员在欧洲(法国、英国)、美国(麻省理工学院、IBM T.J.沃森研究中心)及多个拉丁美洲大学的大学和研究中心任职。阿特金森-阿布特里迪博士的主要研究兴趣包括自然语言处理、文本分析、人工智能及仿生计算。他的学术生涯中,发表了近百篇科学论文,并著有两本书。近年来,他在国内外多个科研和技术项目中走在前沿,担任多家公司人工智能顾问,并创立了AI-Empowered公司。为了表彰他对计算机科学领域的重要贡献,阿特金森-阿布特里迪博士于2010年获得美国计算机协会(ACM)的高级会员奖。在其杰出成就中,他于2005年开发了全球首个基于网络的自然语言对话模型,是现今ChatGPT系统的前身之一。2023年,他发布了他所著书籍的第二版《文本分析:非结构化信息分析的科学与应用导论》(Taylor & Francis,美国),并被Book Authority组织评选为文本挖掘领域的最佳选择。