本书中的设计模式捕捉了机器学习中反复出现的问题的最佳实践和解决方案。作者是三位谷歌工程师,他们列出了经过验证的方法,以帮助数据科学家解决ML过程中的常见问题。这些设计模式将数百位专家的经验整理成简单、可接近的建议。
在这本书中,你会发现关于数据和问题表示、操作化、可重复性、可再现性、灵活性、可解释性和公平性的30种模式的详细解释。每个模式都包含对问题的描述、各种可能的解决方案,以及针对您的情况选择最佳技术的建议。
您将学习如何: 在训练、评估和部署ML模型时,确定并减轻常见的挑战 表示不同ML模型类型的数据,包括嵌入、特征交叉等 针对具体问题选择合适的模型类型 构建一个鲁棒的训练循环,使用检查点、分布策略和超参数调优 部署可扩展的ML系统,您可以重新训练和更新这些系统,以反映新的数据 为利益相关者解释模型预测,并确保模型公平地对待用户
https://www.oreilly.com/library/view/machine-learning-design/9781098115777/
Preface
The Need for Machine Learning Design Patterns
Data Representation Design Patterns
Problem Representation Design Patterns
Model Training Patterns
Design Patterns for Resilient Serving
Reproducibility Design Patterns
Responsible AI
Connected Patterns
Index