如今,大多数数据科学家和工程师都依赖有质量标记的数据来训练机器学习模型。但是,手工构建训练集既耗时又昂贵,导致许多公司的ML项目尚未完成。还有一个更实际的方法。在这本书中,Wee Hyong Tok, Amit Bahree和Senja Filipi向您展示了如何使用弱监督学习模型创建产品。
您将学习如何使用来自Snorkel的弱标记数据集构建自然语言处理和计算机视觉项目,Snorkel是斯坦福人工智能实验室的一个副产品。因为许多公司一直在进行ML项目,但从来没有超越他们的实验室,所以这本书还提供了如何交付您所构建的深度学习模型的指南。
https://www.oreilly.com/library/view/practical-weak-supervision/9781492077053/
了解监督缺乏的领域,包括如何将其作为数据科学过程的一部分 使用Snorkel AI进行弱监督和数据编程 获取使用Snorkel标记文本和图像数据集的代码示例 使用弱标记数据集对文本和图像进行分类 学习将Snorkel与大数据集一起使用以及使用Spark集群来扩展标签的实际注意事项