为AI开发人员的集成学习从历史概述开始,并解释关键的集成技术和为什么需要它们。然后,您将学习如何使用bagging、bootstrap聚合、随机森林模型和交叉验证方法更改训练数据。作者Kumar和Jain提供了最佳实践来指导您结合模型和使用工具来提高机器学习项目的性能。它们会教你如何有效地实现集成概念,如堆叠和推进,以及如何利用流行库,如Keras、Scikit Learn、TensorFlow、PyTorch和Microsoft LightGBM。在不同的数据科学问题,包括时间序列数据、成像数据和NLP中,提出了集成学习的一些技巧。讨论了近年来在集成学习方面的研究进展。示例代码以脚本和IPython笔记本的形式提供。