大多数数据科学家和工程师如今依赖高质量的标注数据来训练机器学习模型。但是,手动构建训练集既耗时又昂贵,导致许多公司的机器学习项目未能完成。有一种更实用的方法。在这本书中,Wee Hyong Tok、Amit Bahree 和 Senja Filipi 向您展示如何使用弱监督学习模型创建产品。您将学习如何使用斯坦福人工智能实验室孵化出的 Snorkel 项目的弱标注数据集来构建自然语言处理和计算机视觉项目。因为许多公司追求的机器学习项目从未超出实验室,这本书还提供了如何发布您构建的深度学习模型的指南。 快速了解弱监督领域,包括将其作为数据科学过程的一部分的方法 使用 Snorkel AI 进行弱监督和数据编程 获取使用 Snorkel 标注文本和图像数据集的代码示例 使用弱标注数据集进行文本和图像分类 了解在大数据集上使用 Snorkel 和使用 Spark 集群扩展标注的实际考虑因素。