【新书】《基于Transformers和扩散模型的生成式人工智能实战》

书籍简介

通过这本实用的操作手册，学习使用生成式人工智能技术创建新颖的文本、图像、音频甚至音乐。读者将理解最先进的生成模型是如何工作的，如何对其进行微调和适应以满足个人需求，以及如何结合现有的构建块创造新的模型和跨领域的创意应用。本书从理论概念介绍开始，紧接着是指导性的实践应用，包含丰富的代码示例和易于理解的插图。你将学习如何使用开源库来利用变换器和扩散模型，进行代码探索，并研究若干现有项目，以帮助指导你的工作。 * 构建和定制能够生成文本和图像的模型 * 探索使用预训练模型与微调自定义模型之间的权衡 * 创建和使用能够生成、编辑和修改任意风格图像的模型 * 为多种创意用途定制变换器和扩散模型 * 训练能够体现你个人风格的模型

作者介绍

Omar Sanseviero 是 Hugging Face 的首席 Llama 官员及平台与社区负责人，领导开发者倡导工程、设备端和月球项目团队。Omar 拥有丰富的工程经验，曾在 Google 的 Google Assistant 和 TensorFlow Graphics 团队工作。Omar 在 Hugging Face 的工作处于开源、产品、研究和技术社区的交汇点。 Pedro Cuenca 是 Hugging Face 的机器学习工程师，负责扩散软件、模型和应用程序。他在互联网应用领域有超过 20 年的开发经验（在西班牙，他参与创建了第一个互动教育门户、第一家网上书店和第一家免费互联网服务提供商）。近年来，他专注于 iOS 开发。作为 LateNiteSoft 的联合创始人兼首席技术官，他开发了成功的 iPhone 摄影应用 Camera+，并为诸如摄影增强和超分辨率等任务创建了深度学习模型。他还参与了 dalle-mini 背后的开发和运营工作。他带来了将人工智能研究融入现实世界服务中的实际愿景，以及其中的挑战与优化。 Apolinário Passos 是 Hugging Face 的机器学习艺术工程师，跨不同团队工作，涉及多个机器学习在艺术与创意领域的应用场景。Apolinário 拥有超过 10 年的专业与艺术经验，曾在举办艺术展览、编程和产品管理之间交替工作，曾担任 World Data Lab 的产品负责人。Apolinário 旨在确保机器学习生态系统能支持并使艺术应用场景变得有意义。 Jonathan Whitaker 是一名数据科学家和深度学习研究员，专注于生成建模。此前，他曾参与与本书所涵盖主题相关的多个课程，包括 Hugging Face 的扩散模型课程，以及他与 Jeremy Howard 在 2022 年共同创建的 Fast.AI 课程《从深度学习基础到稳定扩散》。他还曾在行业中应用这些技术，担任顾问工作，目前全职从事 Answer.AI 的人工智能研究与开发。

成为VIP会员查看完整内容

相关内容