书籍简介
通过这本实用的操作手册,学习使用生成式人工智能技术创建新颖的文本、图像、音频甚至音乐。读者将理解最先进的生成模型是如何工作的,如何对其进行微调和适应以满足个人需求,以及如何结合现有的构建块创造新的模型和跨领域的创意应用。 本书从理论概念介绍开始,紧接着是指导性的实践应用,包含丰富的代码示例和易于理解的插图。你将学习如何使用开源库来利用变换器和扩散模型,进行代码探索,并研究若干现有项目,以帮助指导你的工作。 * 构建和定制能够生成文本和图像的模型 * 探索使用预训练模型与微调自定义模型之间的权衡 * 创建和使用能够生成、编辑和修改任意风格图像的模型 * 为多种创意用途定制变换器和扩散模型 * 训练能够体现你个人风格的模型
作者介绍
Omar Sanseviero 是 Hugging Face 的首席 Llama 官员及平台与社区负责人,领导开发者倡导工程、设备端和月球项目团队。Omar 拥有丰富的工程经验,曾在 Google 的 Google Assistant 和 TensorFlow Graphics 团队工作。Omar 在 Hugging Face 的工作处于开源、产品、研究和技术社区的交汇点。 Pedro Cuenca 是 Hugging Face 的机器学习工程师,负责扩散软件、模型和应用程序。他在互联网应用领域有超过 20 年的开发经验(在西班牙,他参与创建了第一个互动教育门户、第一家网上书店和第一家免费互联网服务提供商)。近年来,他专注于 iOS 开发。作为 LateNiteSoft 的联合创始人兼首席技术官,他开发了成功的 iPhone 摄影应用 Camera+,并为诸如摄影增强和超分辨率等任务创建了深度学习模型。他还参与了 dalle-mini 背后的开发和运营工作。他带来了将人工智能研究融入现实世界服务中的实际愿景,以及其中的挑战与优化。 Apolinário Passos 是 Hugging Face 的机器学习艺术工程师,跨不同团队工作,涉及多个机器学习在艺术与创意领域的应用场景。Apolinário 拥有超过 10 年的专业与艺术经验,曾在举办艺术展览、编程和产品管理之间交替工作,曾担任 World Data Lab 的产品负责人。Apolinário 旨在确保机器学习生态系统能支持并使艺术应用场景变得有意义。 Jonathan Whitaker 是一名数据科学家和深度学习研究员,专注于生成建模。此前,他曾参与与本书所涵盖主题相关的多个课程,包括 Hugging Face 的扩散模型课程,以及他与 Jeremy Howard 在 2022 年共同创建的 Fast.AI 课程《从深度学习基础到稳定扩散》。他还曾在行业中应用这些技术,担任顾问工作,目前全职从事 Answer.AI 的人工智能研究与开发。