【干货书】弱监督实战:小数据学习,Practical Weak Supervision

2022 年 4 月 19 日 专知


如今,大多数数据科学家和工程师都依赖有质量标记的数据来训练机器学习模型。但是,手工构建训练集既耗时又昂贵,导致许多公司的ML项目尚未完成。还有一个更实际的方法。在这本书中,Wee Hyong Tok, Amit Bahree和Senja Filipi向您展示了如何使用弱监督学习模型创建产品。


您将学习如何使用来自Snorkel的弱标记数据集构建自然语言处理和计算机视觉项目,Snorkel是斯坦福人工智能实验室的一个副产品。因为许多公司一直在进行ML项目,但从来没有超越他们的实验室,所以这本书还提供了如何交付您所构建的深度学习模型的指南。


https://www.oreilly.com/library/view/practical-weak-supervision/9781492077053/


了解监督缺乏的领域,包括如何将其作为数据科学过程的一部分

使用Snorkel AI进行弱监督和数据编程

获取使用Snorkel标记文本和图像数据集的代码示例

使用弱标记数据集对文本和图像进行分类

学习将Snorkel与大数据集一起使用以及使用Spark集群来扩展标签的实际注意事项


第1章提供了弱监督领域的基本介绍,以及数据科学家和机器学习工程师如何将其用作数据科学过程的一部分。

第2章讨论了如何开始使用Snorkel进行弱监督,并介绍了使用Snorkel进行数据编程的概念。

第3章描述了如何使用Snorkel进行标签,并提供了如何使用Snorkel对文本和图像数据集进行标签的代码示例。

第4章和第5章作为本书的一部分,使实践者对如何使用弱标记数据集进行文本和图像分类有一个端到端的理解。

第6章讨论了在使用Snorkel和大数据集时的实际考虑,以及如何使用Spark集群来扩展标记。



专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“PWS” 就可以获取【干货书】弱监督实战:小数据学习,Practical Weak Supervision》专知下载链接

专知,专业可信的人工智能知识分发 ,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取70000+AI(AI与军事、医药、公安等)主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取70000+AI主题知识资料
登录查看更多
0

相关内容

【经典书】《数据科学家统计学实战》,409页pdf
专知会员服务
103+阅读 · 2020年12月31日
【Manning2020新书】Elm 实战,344页pdf,Elm in Action
专知会员服务
49+阅读 · 2020年4月14日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
8+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Arxiv
0+阅读 · 2022年6月6日
3D Deep Learning on Medical Images: A Review
Arxiv
12+阅读 · 2020年4月1日
Arxiv
38+阅读 · 2020年3月10日
Arxiv
11+阅读 · 2018年1月18日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
8+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员