弱监督学习是一种有效的机器学习方法,是当前机器学习研究的热门话题,它可以有效减少标注数据所需的人力与时间。该论文提出了一种新颖的基于相似置信度学习的算法,该算法建立了无需真实标签,仅利用成对的无标签样本以及它们之间的相似度构造分类风险无偏估计量,并从理论上证明了该方法的概率收敛误差上界。在大数据时代标签缺失的情况下,对提高数据利用效率方面有着十分重要的意义。

https://arxiv.org/abs/2102.06879

成为VIP会员查看完整内容
28

相关内容

弱监督学习:监督学习的一种。大致分3类,第一类是不完全监督(incomplete supervision),即,只有训练集的一个(通常很小的)子集是有标签的,其他数据则没有标签。这种情况发生在各类任务中。例如,在图像分类任务中,真值标签由人类标注者给出的。从互联网上获取巨量图片很容易,然而考虑到标记的人工成本,只有一个小子集的图像能够被标注。第二类是不确切监督(inexact supervision),即,图像只有粗粒度的标签。第三种是不准确的监督(inaccurate supervision),模型给出的标签不总是真值。出现这种情况的常见原因有,图片标注者不小心或比较疲倦,或者某些图片就是难以分类。
专知会员服务
20+阅读 · 2021年8月1日
专知会员服务
14+阅读 · 2021年6月16日
专知会员服务
22+阅读 · 2021年6月14日
专知会员服务
37+阅读 · 2021年6月3日
专知会员服务
29+阅读 · 2021年5月21日
专知会员服务
81+阅读 · 2021年5月10日
专知会员服务
41+阅读 · 2020年2月20日
【学界】基于生成对抗网络的低秩图像生成方法
GAN生成式对抗网络
9+阅读 · 2018年7月13日
该如何对「半监督学习算法」实际性应用进行评估?
炼数成金订阅号
7+阅读 · 2018年4月27日
论文浅尝 | 基于置信度的知识图谱表示学习框架
开放知识图谱
24+阅读 · 2018年2月27日
最新|深度离散哈希算法,可用于图像检索!
全球人工智能
14+阅读 · 2017年12月15日
Arxiv
9+阅读 · 2019年4月19日
Arxiv
6+阅读 · 2018年6月21日
VIP会员
相关VIP内容
专知会员服务
20+阅读 · 2021年8月1日
专知会员服务
14+阅读 · 2021年6月16日
专知会员服务
22+阅读 · 2021年6月14日
专知会员服务
37+阅读 · 2021年6月3日
专知会员服务
29+阅读 · 2021年5月21日
专知会员服务
81+阅读 · 2021年5月10日
专知会员服务
41+阅读 · 2020年2月20日
微信扫码咨询专知VIP会员