半监督学习加速AI产业数据标注

2019 年 4 月 2 日 QCon

作者介绍:孙鹏,苏宁大数据实验室高级数据科学家,美国弗吉尼亚理工大学统计学博士,研究方向是非参数贝叶斯理论。读博期间在Capital  One银行实习参与用户分级项目。拥有7年以上数据科学建模经验,博士毕业后在KPMG就职并单独承担OR模型的开发,并曾在美国房地美公司负责模型风险调控。2018年加入苏宁参与个人贷款风控模型的研发。精通R,Python和Rcpp,对机器学习领域的新方法感兴趣。曾在Kaggle历史总奖金最高的比赛(Zillow Price)排名第一。

演讲概述

数据标注在人工智能领域是决定数据质量的关键一环,而丰富的标签是成功的机器学习建模的先决条件。在诸如图像识别、文本识别和语音识别等领域,未知的图片、文本和音频往往因为需要人工打标签而耗费大量成本。半监督学习正是一种潜在的降低此类成本的方法。通过人工智能和人工标注更有效的“互动”,半监督学习可以加速数据标注的流程。

主要内容:

1. 人工智能领域数据标签简介;

2. 半监督学习简介,以及和有监督学习、无监督学习的区别;

3. 半监督学习常见方法;

4. 半监督学习加速数据标注的机制。

听众收益:

1. 了解人工智能领域易被忽视却又至关重要的一环:数据标注;

2. 理解机器学习领域监督学习,无监督学习和半监督学习的区别;

3. 了解人工智能领域利用半监督学习加速数据标注的实例。

演讲视频

幻灯片


在QCon公众号后台回复“0402

即可下载完整幻灯片





以上就是孙鹏老师在 QCon 上海 2018 的精彩分享,更多话题探索请持续关注新一届的 QCon 大会。

目前大会 9 折 报名中,立减 880 元。点击 「阅读原文」或识别二维码了解 QCon 十周年的精心策划。有任何问题欢迎联系票务小姐姐 Ring:电话 010-53935761,微信 qcon-0410。


登录查看更多
12

相关内容

半监督学习(Semi-Supervised Learning,SSL)是模式识别和机器学习领域研究的重点问题,是监督学习与无监督学习相结合的一种学习方法。半监督学习使用大量的未标记数据,以及同时使用标记数据,来进行模式识别工作。当使用半监督学习时,将会要求尽量少的人员来从事工作,同时,又能够带来比较高的准确性,因此,半监督学习目前正越来越受到人们的重视。
干净的数据:数据清洗入门与实践,204页pdf
专知会员服务
161+阅读 · 2020年5月14日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
195+阅读 · 2020年3月8日
【上海交大】半监督学习理论及其研究进展概述
专知会员服务
70+阅读 · 2019年10月18日
2019年人工智能行业现状与发展趋势报告,52页ppt
专知会员服务
121+阅读 · 2019年10月10日
医疗知识图谱构建与应用
专知会员服务
384+阅读 · 2019年9月25日
报告 | 2019中国人工智能产业知识产权发展白皮书
数据科学浅谈
7+阅读 · 2019年11月14日
爱奇艺视频人物识别技术及应用
QCon
7+阅读 · 2019年4月8日
企业数据AI化战略:从数据中台到AI中台
36大数据
11+阅读 · 2019年2月18日
智能时代如何构建金融反欺诈体系?
数据猿
12+阅读 · 2018年3月26日
Arxiv
4+阅读 · 2020年3月27日
Arxiv
9+阅读 · 2019年4月19日
Arxiv
8+阅读 · 2018年4月8日
Arxiv
19+阅读 · 2018年3月28日
Arxiv
7+阅读 · 2018年3月22日
VIP会员
相关VIP内容
干净的数据:数据清洗入门与实践,204页pdf
专知会员服务
161+阅读 · 2020年5月14日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
195+阅读 · 2020年3月8日
【上海交大】半监督学习理论及其研究进展概述
专知会员服务
70+阅读 · 2019年10月18日
2019年人工智能行业现状与发展趋势报告,52页ppt
专知会员服务
121+阅读 · 2019年10月10日
医疗知识图谱构建与应用
专知会员服务
384+阅读 · 2019年9月25日
相关资讯
相关论文
Arxiv
4+阅读 · 2020年3月27日
Arxiv
9+阅读 · 2019年4月19日
Arxiv
8+阅读 · 2018年4月8日
Arxiv
19+阅读 · 2018年3月28日
Arxiv
7+阅读 · 2018年3月22日
Top
微信扫码咨询专知VIP会员