掌握 训练视觉和大型语言模型的艺术,理解概念基础并获得行业专家的指导。了解AWS服务和设计模式,并提供相关的编程示例。
主要特点 学习开发、训练、调整和应用优化的端到端流程的基础模型 通过AWS和SageMaker的示例,探索模型和数据集的大规模分布式训练 评估、部署并将您的定制模型运营化,包括偏差检测和流程监控 基础模型已经永久性地改变了机器学习。从BERT到ChatGPT,从CLIP到稳定扩散,当数十亿的参数与大数据集和数百至数千的GPU结合时,其结果无疑是创纪录的。本书中的建议、建议和代码样本将帮助您在AWS和Amazon SageMaker上从头开始预训练和微调您自己的基础模型,同时将它们应用到您的组织中的数百个用例。
在经验丰富的AWS和机器学习专家Emily Webber的建议下,本书将帮助您学习从项目构思到数据集准备,训练,评估,部署大型语言,视觉和多模型的一切所需知识。通过对基础概念的逐步解释和实用示例,您将从掌握预训练的概念到准备您的数据集和模型,配置环境,训练,微调,评估,部署,优化您的基础模型。 您将学习如何将规模定律应用于在多个GPU上分发您的模型和数据集,消除偏差,达到高吞吐量,并构建部署流程。
到本书结束时,您将充分准备好自己开始预训练和微调未来的基础模型的项目。 您将学到什么 找到预训练和微调的正确用例和数据集 准备大规模训练,使用自定义加速器和GPU 在AWS和SageMaker上配置环境以最大化性能 根据您的模型和约束条件选择超参数 使用多种并行方式分发您的模型和数据集 避免因工作重启、间歇性健康检查等问题导致的陷阱 使用定量和定性洞察评估您的模型 部署您的模型,并用监控流水线进行运行时改进