【导读】吴恩达的免费电子书《Machine Learning Yearning》以较高的层次为我们介绍了许多在机器学习时代AI工程师应该掌握的技术策略。该书并不聚焦于具体的AI算法,而是为我们介绍了许多具有泛化性的如何让AI算法有效工作的技术。
人工智能正在改变许多行业。《Machine Learning Yearning: Technical Strategy for AI Engineers, In the Era of Deep Learning》(《机器学习向往—机器学习时代AI工程师的技术策略》)是一本由Andrew Ng提供的免费电子书,教你如何组织机器学习项目。这本书的重点并不是教你具体的机器学习算法,而是如何让机器学习算法有效工作。
读完这本书,你将能够:
优先考虑最有前景的AI项目方向
诊断机器学习系统中的错误
在复杂的设置中进行机器学习,例如不匹配的训练/测试集
建立一个机器学习项目来达到或超越人类的水平
了解何时以及如何应用端到端学习、迁移学习和多任务学习
该书的原版为英文版,Github上也有该书的开源中文翻译版:
https://github.com/deeplearning-ai/machine-learning-yearning-cn
《Machine Learning Yearning》的内容如下(参考自翻译版):
机器学习为什么需要策略?
如何使用此书来帮助你的团队
先修知识与符号说明
规模驱动机器学习发展
开发集和测试集的定义
开发集和测试集应该服从同一分布
开发集和测试集应该有多大??
使用单值评估指标进行优化
优化指标和满意度指标
通过开发集和度量指标加速迭代
何时修改开发集、测试集和指标
小结:建立开发集和测试集
快速构建并迭代你的第一个系统
误差分析:根据开发集样本评估想法
在误差分析时并行评估多个想法
清洗误标注的开发集和测试集样本
将大型开发集拆分为两个子集,专注其一
Eyeball 和 Blackbox 开发集该设置多大?
小结:基础误差分析
偏差和方差:误差的两大来源
偏差和方差举例
与最优错误率比较
处理偏差和方差
偏差和方差间的权衡
减少可避免偏差的技术
训练集误差分析
减少方差的技术
诊断偏差与方差:学习曲线
绘制训练误差曲线
解读学习曲线:高偏差
解读学习曲线:其它情况
绘制学习曲线
为何与人类表现水平进行对比
如何定义人类表现水平
超越人类表现水平
何时在不同的分布上训练与测试
如何决定是否使用你所有的数据
如何决定是否添加不一致的数据
给数据添加权重
从训练集泛化到开发集
辨别偏差、方差和数据不匹配误差
解决数据不匹配问题
人工合成数据
优化验证测试
优化验证测试的一般形式
强化学习举例
端到端学习的兴起
端到端学习的更多例子
端到端学习的优缺点
流水线组件的选择:数据可用性
流水线组件的选择:任务简单性
直接学习更为丰富的输出
根据组件进行误差分析
误差归因至某个组件
误差归因的一般情况
组件误差分析与人类水平对比
发现有缺陷的机器学习流水线
建立超级英雄团队 - 让你的队友阅读这本书吧!
教程部分截图如下所示:
参考资料:
https://www.deeplearning.ai/machine-learning-yearning/
https://github.com/deeplearning-ai/machine-learning-yearning-cn