书籍简介
通过数学、插图和代码掌握语言模型,并从零开始构建自己的模型! 《百页语言模型书》由Andriy Burkov编写,是其畅销书《百页机器学习书》的续集(现已翻译成12种语言),为读者提供了从语言建模基础到现代大型语言模型(LLM)前沿的简洁而深入的学习旅程。借助Andriy著名的“百页”格式,读者将掌握理论概念和实际实现,是开发者、数据科学家和机器学习工程师的宝贵资源。 《百页语言模型书》将帮助你: * 掌握现代机器学习和神经网络的数学基础 * 用Python构建和训练三种语言模型架构 * 从零开始理解并编写基于Transformer的语言模型(使用PyTorch) * 使用LLM,包括指令微调和提示工程
本书以实践为导向,包含可运行的Python代码示例,逐步提升读者的理解,从基础机器学习概念到高级语言模型架构。所有代码示例均可在Google Colab上运行,任何拥有现代笔记本电脑的人都可以访问。 关于技术
语言模型已经从简单的n-gram统计方法演变为AI领域最具变革性的技术之一,其影响力仅次于个人计算机。本书涵盖了语言模型的完整演变——从基于计数的方法到现代的Transformer架构——深入理解这些模型的工作原理以及如何实现它们。 关于本书
《百页语言模型书》采取独特的方式,逐步介绍语言建模概念,从基础方法开始,逐步深入到现代架构。每一章都建立在前一章的基础上,通过清晰的解释、图示和实际实现,使复杂概念变得易于理解。 本书内容
机器学习和神经网络的基本原理 * 文本表示技术和基础语言建模 * 使用PyTorch实现RNN和Transformer架构 * 关于语言模型微调和提示工程的实用指导 * 重要的幻觉问题及模型评估方法 * 通过本书的维基提供的高级主题资源
完整代码和额外资源可以通过本书的网站在thelmbook.com/wiki上访问。 读者群体
读者应具备Python编程经验。虽然了解PyTorch和张量有帮助,但不是必需的。具备大学水平的数学知识会有助于理解,但本书通过直观的例子和图示以清晰的方式呈现数学概念。 技术和AI领袖的推荐
Vint Cerf,互联网先驱,图灵奖得主:“这本书帮我澄清了很多关于机器学习如何运作的概念——它是一本清晰的瑰宝。” * Tomáš Mikolov,word2vec和FastText的作者:“这本书是任何语言建模新手的良好起点,尤其适合那些渴望在现有技术基础上改进的读者。” * Florian Douetteau,Dataiku联合创始人兼首席执行官:“Andriy为我们呈现了从线性代数基础到Transformer实现的精彩历程,堪称100幅精彩画作。” * Jerry Liu,LlamaIndex联合创始人兼首席执行官:“这是一本最全面却又简明的手册,帮助我们深入理解LLM如何在幕后运作。”
更多AI领域领袖的推荐,敬请访问thelmbook.com。
创建基于大语言模型(LLM)的自主代理和智能助手,量身定制以满足您的业务和个人需求。 从无需脚本的客户服务聊天机器人,到完全独立、无缝运行的后台代理,AI驱动的助手代表了机器智能的突破。《AI代理的应用》一书将帮助您掌握一个经过验证的框架,开发能够处理现实世界业务和个人任务的实用代理。 作者Micheal Lanham将前沿的学术研究与实践经验相结合,帮助您:
您不会遇到需要不断监督的玩具示例或脆弱的助手。《AI代理的应用》教您构建值得信赖的AI,能够处理高风险谈判。您将掌握提示工程技术,创建具有独特个性和档案的代理,并开发能够在不可预测环境中蓬勃发展的多代理协作。超越学习新技术,您将发现一种变革性的问题解决方法。 购买纸质书将包括Manning出版社提供的免费的PDF和ePub格式电子书。
大多数生产环境中的AI系统需要用户、AI模型和各种数据源之间的多次协调互动。AI代理捕获并组织这些互动,将其转化为能够处理信息、做出决策并从背后互动中学习的自主组件。本书将向您展示如何创建AI代理,并将它们连接成强大的多代理系统。
在《AI代理的应用》一书中,您将学习如何构建可投入生产使用的助手、多代理系统和行为代理。您将掌握代理的核心部分,包括增强检索的知识和记忆,同时创建可以使用软件工具、自动规划任务并从经验中学习的多代理应用程序。通过探索众多有趣的示例,您将使用OpenAI Assistants API、GPT Nexus、LangChain、Prompt Flow、AutoGen和CrewAI等先进工具。
适合中级Python程序员。
Micheal Lanham是一位软件和技术创新者,拥有超过20年的行业经验。他曾出版有关深度学习的书籍,包括Manning的《进化深度学习》。
Micheal Lanham是一位经过验证的软件和技术创新者,拥有超过20年的行业经验。他在游戏、图形、网页、桌面、工程、人工智能、地理信息系统(GIS)和机器学习等多个领域开发过各种软件应用程序,服务于多个行业。21世纪初,Micheal开始在游戏开发中使用神经网络和进化算法。
书籍描述
数字孪生技术在制造业、能源、医疗保健和交通等各个领域迅速发展并获得广泛应用。数字孪生是对物理系统或过程的虚拟表示,能够实现实时监控、分析和优化。本书将全面介绍数字孪生技术及其进展与应用。对于从事工程学、计算机科学、数据分析及工业4.0领域的研究人员、学者、从业者和学生而言,将是一本有益的参考书。封底介绍
数字孪生技术在制造业、能源、医疗保健和交通等各个领域迅速发展并获得广泛应用。数字孪生是对物理系统或过程的虚拟表示,能够实现实时监控、分析和优化。本书将全面介绍数字孪生技术及其进展与应用。对于从事工程学、计算机科学、数据分析及工业4.0领域的研究人员、学者、从业者和学生而言,将是一本有益的参考书。作者简介
孙日尔(Dr. Sunil Gupta)教授是一位知名学者和研究人员,拥有超过20年的计算机科学与工程领域的教学、研究和行业经验。作为印度著名的国家理工学院贾兰达尔分校和哈米尔普尔分校的校友,孙教授将学术和行业的见解完美结合,打造了卓越的职业生涯。他曾在多个知名机构任职,包括UPES大学、BML孟贾尔大学、德里技术学院、IP大学、北印度工程学院、巴迪新兴科学大学和IFTM大学及物理实验室。他在课程开发方面做出了显著贡献,尤其是在UPES和BMU,他曾主导设计创新的技术课程,涉及前沿科技领域。孙教授的研究兴趣包括网络安全、云计算、大数据、无线传感器网络和医疗健康。他已在知名期刊和会议上发表超过100篇研究论文,拥有10项专利。他还编写了六本关于网络安全和人工智能的教材,并获得了政府和私营组织的研究资助。凭借其专业能力,孙教授曾担任多个国际期刊的审稿人,并且在工程学和物理科学领域的科学委员会和编辑审稿委员会担任职务。作为一名敬业的教师,孙教授指导了许多学生的研究和项目工作。他还组织过各种研讨会、会议和教师发展项目,并常常应私营和政府组织的邀请担任技术专家。他曾参与多个专家小组,包括教师招聘和机构评估专家小组。S. Ravi Shankar博士是一位技术专家,拥有超过30年的经验(博士后),专注于设计、开发和运营大规模复杂产品,并管理利用物联网、分布式系统、人工智能和自动驾驶车辆(如无人机)等技术提升运营效率和韧性的业务,推动了公司收入和利润的双重增长。他在领导跨四大洲、多个市场和领域(电信、交通、医疗和金融科技)的产品开发和管理团队方面积累了丰富经验。作为一名领导者,他提供了基于丰富经验的务实见解。他曾管理过超过1亿美元的收入流,并创造了多个获奖产品(如2002年TMC杂志的年度互联网电话产品奖)。他曾创办四家公司,并为30多家初创公司提供指导和咨询。他是PoMA(Proof-of-Match Adaptive)的发明人,这是一种为高速区块链设计的快速、公平、量子抗性领导者选举机制。同时,他还发明了一种与PoMA配套使用的信任模型,实现了一种高速共识机制,具有拜占庭容错性,并且可执行的资源占用极低。他拥有多个正在处理中的专利,并提供了两项最近专利申请的链接。Sanjeev Kumar博士,拥有坚实的教育背景和对学习的热情,带来了丰富的知识和专业经验。他在新德里的贾瓦哈拉尔·尼赫鲁大学(Jawaharlal Nehru University)计算机与系统科学学院获得了博士学位,论文题目为《神经元集群中峰值模式的随机建模与蒙特卡洛仿真》。此外,他还拥有Dayalbagh教育学院(被认证为大学)颁发的M.Tech和B.E学位。Prof. Sanjeev有超过23年的高等教育经验,是一位能够出色管理团队、进行研究和行政管理的学者。他在系级和院级研究与开发工作中做出了重要贡献。对于促进研究和创新文化,他建立了一个卓越中心,并指导教师成员撰写研究论文和专利申请,同时担任SCI期刊的审稿人和研究书籍的编辑。
书籍简介
本书的第五版对时间域和频率域方法进行了平衡且全面的介绍,并附有相关理论。书中包含了大量使用非平凡数据的实例,展示了如何解决诸如发现自然与人为气候变化、通过功能性磁共振成像评估疼痛感知实验、以及监测核试验禁令等问题。R包‘astsa’进行了重要更新,文本中会反映这些更新。总体来说,图形得到了改善。新增的主题包括随机数生成、捕食者-猎物相互作用的建模与拟合、更强调结构模型、线性检验、EM算法的更深入讨论、状态空间模型和MCMC的贝叶斯分析(包括‘astsa’中的新脚本)、粒子方法的引入、随机波动性扩展、变化点检测(新主题)。 本书旨在作为物理学、生物学和社会科学领域研究生的教材,以及统计学的研究生教材。某些部分也可作为本科生的入门课程。理论与方法部分分开,以便能够根据不同层次的需求进行呈现。除了涵盖经典的时间序列回归、ARIMA模型、谱分析和状态空间模型外,书中还包括了现代的进展,如类别时间序列分析、多变量谱方法、长记忆序列、非线性模型、重采样技术、GARCH模型、ARMAX模型、随机波动性和马尔可夫链蒙特卡罗积分方法。 本版包含了每个数值实例的R代码。
书籍简介
2022年末,随着先进语言模型如ChatGPT的出现,自然语言生成(NLG)技术的突出地位得到了极大的提升。尽管这些发展在学术界和商业领域引起了广泛关注,但焦点主要集中在最新的创新上,常常忽视了NLG领域丰富的历史和基础性工作。本书旨在提供NLG的全面概述,不仅涵盖语言模型,还包括替代方法、用户需求、评估方法、安全性和测试协议,以及实际应用。本书基于数十年的NLG研究,旨在为研究人员和开发者提供宝贵的资源,提供的见解将超越当前技术格局,具有持久的相关性。 自然语言生成聚焦于数据到文本的转化,但也探讨了其他类型的NLG,如文本摘要。书中采取了整体化的NLG视角,关注用户需求(用户所寻求的)、设计、数据问题、测试、评估、安全性和伦理问题以及技术等多个方面。这一整体性方法是本书的独特之处,对于构建实际应用NLG系统的开发者,以及对应用型NLG感兴趣的学术界和研究人员具有重要价值。 作者曾于2000年共同编著了一本开创性的NLG书籍,他强调了高层次的概念和方法论,确保了本书内容的长久生命力和实用性。全书结构力求平衡技术深度与实践相关性,涵盖了基于规则和神经网络的NLG方法、用户需求、严谨的评估技术和安全考虑等章节。书中还通过探讨新闻学、商业智能、摘要生成和医学等领域的实际应用,展示了NLG的潜力和可扩展性。通过作者个人的轶事和经验实例,本书为NLG这一发展中的领域提供了独特且引人入胜的视角,是那些希望利用语言生成技术力量的读者不可或缺的指南。
封底内容
2022年末,随着先进语言模型如ChatGPT的出现,自然语言生成(NLG)技术的突出地位得到了极大的提升。尽管这些发展在学术界和商业领域引起了广泛关注,但焦点主要集中在最新的创新上,常常忽视了NLG领域丰富的历史和基础性工作。本书旨在提供NLG的全面概述,不仅涵盖语言模型,还包括替代方法、用户需求、评估方法、安全性和测试协议,以及实际应用。本书基于数十年的NLG研究,旨在为研究人员和开发者提供宝贵的资源,提供的见解将超越当前技术格局,具有持久的相关性。 自然语言生成聚焦于数据到文本的转化,但也探讨了其他类型的NLG,如文本摘要。书中采取了整体化的NLG视角,关注用户需求(用户所寻求的)、设计、数据问题、测试、评估、安全性和伦理问题以及技术等多个方面。这一整体性方法是本书的独特之处,对于构建实际应用NLG系统的开发者,以及对应用型NLG感兴趣的学术界和研究人员具有重要价值。 作者曾于2000年共同编著了一本开创性的NLG书籍,他强调了高层次的概念和方法论,确保了本书内容的长久生命力和实用性。全书结构力求平衡技术深度与实践相关性,涵盖了基于规则和神经网络的NLG方法、用户需求、严谨的评估技术和安全考虑等章节。书中还通过探讨新闻学、商业智能、摘要生成和医学等领域的实际应用,展示了NLG的潜力和可扩展性。通过作者个人的轶事和经验实例,本书为NLG这一发展中的领域提供了独特且引人入胜的视角,是那些希望利用语言生成技术力量的读者不可或缺的指南。
关于作者
Ehud Reiter是阿伯丁大学计算机科学教授,并曾担任Arria NLG(他共同创办的公司)的首席科学家。在这两个角色中,他一直致力于自然语言生成的研究工作。自1990年获得哈佛大学NLG博士学位以来,他一直从事NLG领域的研究,是该领域发表和被引用最多的作者之一。他已经发表了超过200篇学术论文和8项专利。他曾于2019至2022年担任计算语言学协会生成专项兴趣小组(SIGGEN)主席,并于2022年因其NLG工作的贡献获得了“时代测试奖”。
《数据科学中的因果推断》书籍简介当你了解事件的原因时,你就能够影响其结果。本书为因果推断提供了一本易于理解的入门指南,展示了如何通过统计学和机器学习来确定因果关系和估算效应。A/B 测试或随机对照实验成本高昂,在商业环境中往往难以实施。《数据科学中的因果推断》揭示了即使没有进行实验或测试,依然可以利用数据识别因果关系的方法和技术。在《数据科学中的因果推断》一书中,你将学习如何:
使用因果图建模现实
运用统计学和机器学习技术估算因果效应
确定何时使用 A/B 测试、因果推断和机器学习
解释和评估目标、假设、风险和局限性
确定分析中是否拥有足够的变量 通过了解因果关系,你不仅可以做出基于数据的预测,还可以进行干预以影响结果。《数据科学中的因果推断》将展示如何构建数据科学工具,识别趋势和事件的根本原因。你将学习如何解读历史数据,理解客户行为,并为管理层提供决策支持,帮助其做出最优决策。购买本书的纸质版将免费附赠 PDF 和 ePub 格式的电子书(来自 Manning Publications)。关于技术为什么你会得到某个特定的结果?是什么因素导致了不同的结果?这些是因果推断中的核心问题。这一强大的方法论能够在无法进行实验、A/B 测试或昂贵的对照试验时,依然帮助你做出更好的决策,通过连接因果关系来改进决策。关于本书《数据科学中的因果推断》介绍了将因果推理应用于日常商业场景的技术。通过这本清晰易懂的实用指南,你无需掌握高级统计学或高等数学就能实践因果推断!通过应用基于有向无环图(DAG)的简单方法,你将学会如何评估广告效果、选择有效的健康治疗方案、制定合理的产品定价等。本书内容
何时使用 A/B 测试、因果推断和机器学习
评估目标、假设、风险和局限性
将因果推断应用于实际商业数据 读者对象适合数据科学家、机器学习工程师和统计学家。作者介绍Aleix Ruiz de Villa Robert 是一位自由职业的数据科学顾问,拥有来自巴塞罗那自治大学的数学分析博士学位。Aleix 曾在新闻、零售、交通和软件开发行业工作,并且是巴塞罗那数据科学与机器学习聚会的创始人。
信息时代给我们带来了巨大的可能性和独特的挑战。技术发展日新月异,新应用层出不穷,对于通信行业来说,这是一个令人兴奋的时代。对于一个被认为是电信业发展最快的国家来说,如何清楚地了解射频(RF)频谱及其最佳利用,是一个值得关注的问题。
射频频谱是一种稀缺、有限的自然资源,频谱管理和监管机制是确保高效、无干扰使用频谱的关键因素。射频频谱跨越地理和政治边界;因此,在国际层面就有效、合理和基于需求的频谱使用进行协调是频谱管理的标志。国际电信联盟(ITU)是管理频谱的国际论坛,而印度通信与信息技术部(MoC&IT)下属的无线规划委员会(WPC)则扮演着频谱管理者的角色,而印度电信与信息管理局(TRAI)则扮演着监管机构的角色,在满足国防/政府机构的战略需求和商业需求(这两者都符合国家利益)之间取得微妙的平衡。因此,必须了解全球、地区和国家层面的频谱监管组织和流程,以优化武装部队的频谱需求预测。
以前,如果想发展一个村庄,人们会要求政府修建一条公路,因为公路一旦建成,就为村民打开了通往全国其他地区的大门,他们可以在那里出售自己的产品,此外还为企业发展、就业、教育和医疗保健提供了渠道。就因为有了这条公路的连接,村子才得以发展壮大。在数字时代,射频频谱提供 2G、3G 和 4G 连接(5G 即将到来),这些都是企业发展和教育、医疗保健及其他基础设施发展所需的数字高速公路。数字连接不仅仅是通信问题,事实上,它还关系到工业、自动化、教育、医疗保健和其他基础设施领域的改善和发展--这样的例子不胜枚举。正如最近的 COVID-19 危机所证明的那样,这是一条促进各领域运作和发展的端到端之路。随着世界被封锁以遏制这一流行病的蔓延,国家治理、日常行政管理、基本商品和服务的提供、教育和商业只有通过已建立的通信和 IT 网络才能实现,而无线网络网格在很大程度上促进了这些网络的发展。这就是频谱的重要性。
我们的社会和世界大部分地区正从工业时代向信息时代迈进,这在很大程度上得益于频谱的自由化,而频谱的自由化反过来又导致了社交媒体的普及。这也对武装部队产生了影响,为敌我双方提供了机遇和挑战。
控制地理技术领域的国家将控制所有其他三个领域,即地理战略、地理政治和地理经济;控制这三个领域的国家将控制世界。在新兴的世界秩序中,印度可以发挥重要作用;虽然印度是全球参与者,但要成为全球领导者,印度需要优化利用射频频谱,并驾驭 5G 和物联网等最新技术。
国防频谱需求需要在国家、地区和全球层面进行明智的管理和调整,以确保高效、无干扰地利用频谱。鉴于目前正在进行的商业应用频谱分配竞争,国防部门有必要了解和掌握全球、地区和国家层面的频谱管理组织和流程,以确保对武装部队的频谱需求进行最佳预测。了解频谱需求极为重要,这样才能以最佳方式应用或利用频谱来获取军事利益。
无线电频谱是一种稀缺有限的自然资源,频谱范围从 3 KHz 到 3000 GHz,其中频谱管理和监管机制是确保有效和不受干扰地使用频谱的关键因素。无线电波的传播在不同的频段具有不同的特性,并且受到宇宙/人造噪音现象、地形和不同气候条件的影响。尽管射频(RF)频谱看似广泛,但其使用却受到很大限制,因为其使用取决于是否有适当的商业通信技术。有效、合理和按需使用频谱是频谱管理的标志。
在 2006 年之前,国防部队一直掌握着大部分频谱。然而,随着主要用于移动电话(尤其是 2G 和 3G 服务)和数字电视广播的频谱需求不断增长,人们认为有必要将目前由国防军持有的频谱用于商业用途。这导致了对国家频率行动计划(NFAP)的审查。同时,为了满足武装部队的通信需求,2015 年确定并颁布了国防频段(DB),其中 09 个子频段专门用于国防用途,而其余 42 个子频段则要求国防部队与其他商业用户共存。电磁频谱中的国防频段是一种主要资源,需要对其进行明智的管理,以确保高效和无干扰的利用。
不过,DB 仍可接受审查,其中未被国防使用/指定使用的部分可能会被用于商业/其他目的的拍卖。DB 计划在五年后,即 2020 年进行审查。然而,由于 5G 即将推出以及其他国家利益,可能需要提前对其进行审查,武装部队必须为此做好准备。如果发现目前指定用于国防的部分频谱未被利用,也有可能在与国防部协商后进行审查。
鉴于可能会出现为商业应用分配频谱的竞争,武装部队必须能够优化规划分配给他们的频谱的使用,并对目前持有的频谱进行明智的管理。与此同时,国防频段(DB)还需要从国防行动的战略意义、国防采购的漫长酝酿期以及最高层正在实施的关键改革举措等角度加以审视。这项研究是朝着这个方向迈出的一步,即尽管武装部队受到特殊的限制,但他们能够克服及时获取频谱的挑战,同时继续完成规定的任务。研究指出,国防频谱不能孤立地看待,因为频谱是一种国家资源,国防频谱与未来技术、市场结构和政府政策的变化息息相关。报告还解释了理解和解决这一问题的必要性,并涉及频谱自由化的一个意外但非常相关的分支,即频谱自由化对社交媒体扩散的影响及其对武装部队的影响。