《构建LLM应用》深入探讨了LLMs提供的基本概念、前沿技术和实际应用,最终为扩展AI能力的大型基础模型(LFMs)的出现铺平了道路。 本书首先深入介绍了LLMs。接着,我们探索了各种主流的架构框架,包括专有模型(GPT 3.5/4)和开源模型(Falcon LLM),分析它们的独特优势和差异。随后,重点介绍了基于Python的轻量级框架LangChain。我们引导读者通过使用LLMs和强大的工具包创建能够从非结构化数据中检索信息并与结构化数据交互的智能代理。此外,书中还探讨了超越语言建模的LFMs领域,涵盖各种AI任务和模态,如视觉和音频。 无论你是经验丰富的AI专家还是该领域的新手,这本书都是你解锁LLMs全部潜力并开启智能机器新时代的路线图。
本书适合希望通过LLMs构建应用的软件工程师和数据科学家。本书也适合对应用LLM主题感兴趣的技术领导者、学生和研究人员。 我们不假设读者之前有LLM的相关经验,但读者应具备基本的机器学习/软件工程基础,以理解和应用内容。
在完成了金融学学士学位后,Valentina Alto于2021年获得数据科学硕士学位。她在微软开始了职业生涯,担任Azure解决方案专家,自2022年以来,主要专注于在制造和制药行业工作,与数据和AI解决方案相关。Valentina与系统集成商紧密合作,特别关注部署结合现代数据平台、数据网格框架和机器学习及人工智能应用的云架构。 在学术研究过程中,她热衷于AI和Python编程,积极撰写有关统计、机器学习、深度学习和AI的技术文章,并在各种出版物上发表。