最新《标签噪声表示学习的研究:过去、现在和将来》2020综述论文,24页pdf

2020 年 11 月 11 日 专知



经典的机器学习隐含地假设训练数据的标签是从一个干净的分布中采样的,这对于真实的场景来说限制太大了。然而,基于统计学习的方法可能不能很好地训练深度学习模型。因此,迫切需要设计标签噪声表示学习(LNRL)方法对带噪声标签的深度模型进行鲁棒训练。为了充分了解LNRL,我们进行了综述。我们首先从机器学习的角度阐明LNRL的形式化定义。然后,通过学习理论和实证研究的视角,找出了噪声标签影响深度模型性能的原因。在此基础上,我们将不同的LNRL方法分为三个方向。在这个统一的分类法下,我们将全面讨论不同类别的优缺点。更重要的是,我们总结了鲁棒的LNRL的基本组件,它们可以激励新的方向。最后,我们提出了LNRL可能的研究方向,如新数据集、实例依赖的LNRL和对抗性LNRL。最后,我们展望了LNRL之外的潜在方向,比如使用特征噪声、偏好噪声、领域噪声、相似性噪声、图形噪声和演示噪声进行学习。


https://arxiv.org/abs/2011.04406


标签噪声表示学习在学术界和工业界都非常重要。背后有两个原因。首先,从学习范式的本质来看,深度监督学习需要大量的有良好标签的数据,这可能需要太多的成本,尤其是对于许多初创企业来说。然而,深度无监督学习(甚至是自我监督学习)还不够成熟,无法在复杂的现实场景中很好地发挥作用。因此,作为深度弱监督学习,标签噪声表示学习自然受到了广泛的关注并成为研究的热点。其次,从数据方面来看,许多真实的场景缺乏纯粹干净的注释,比如金融数据、web数据和生物医学数据。这直接激发了研究人员探索标签噪声表示学习。


据我们所知,确实有三篇关于标签噪声的综述的工作。Frenay和Verleysen[8]专注于讨论标签噪声统计学习,而不是标签噪声表示学习。尽管Algan等人[9]和Karimi等人[10]。它们都专注于带噪声标签的深度学习,都只考虑图像(或医学图像)的分类任务。此外,他们的调查是从应用的角度写的,而不是讨论方法。为了弥补这些缺陷,我们希望对标签噪声表示学习领域做出如下贡献。



  • 从机器学习的角度,我们给出了标签噪声表示学习(LNRL)的正式定义。这个定义不仅足够通用,可以包含所有现有的LNRL,而且也足够具体,可以阐明LNRL的目标是什么以及我们如何解决它。


  • 与[9]、[10]相比,通过学习理论的视角,我们更深入地理解了为什么噪声标签会影响深度模型的性能。同时,我们报告了在噪声标签下的深度模型的泛化,这与我们的理论发现是一致的。


  • 我们进行了大量的文献综述,从表示学习开始,并在一个统一的分类,在数据,目标和优化。分析了不同类别的利弊。我们还对每个类别的见解进行了总结。


  • 基于上述观察,我们总结和讨论了鲁棒标签噪声表示学习的基本组成部分。这些可以帮助启发标签噪声表示学习的新方向。


  • 除了标签噪声表示学习,我们提出了几个有前途的未来方向,如学习噪声特征、偏好、领域、相似性、图和演示。我们希望他们能提供一些见解。



专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“NLRL” 可以获取《最新《标签噪声表示学习的研究:过去、现在和将来》2020综述论文,24页pdf》专知下载链接索引

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
1

相关内容

最新《监督机器学习可解释性》2020大综述论文,74页pdf
专知会员服务
130+阅读 · 2020年11月19日
最新《对比监督学习》综述论文,20页pdf
专知会员服务
85+阅读 · 2020年11月5日
最新《低资源自然语言处理》综述论文,21页pdf
专知会员服务
60+阅读 · 2020年10月27日
专知会员服务
65+阅读 · 2020年9月10日
最新《深度持续学习》综述论文,32页pdf
专知会员服务
182+阅读 · 2020年9月7日
西北大学等最新《深度主动学习》全面综述论文,30页pdf
专知会员服务
101+阅读 · 2020年7月20日
最新《深度半监督学习》综述论文,43页pdf
专知会员服务
156+阅读 · 2020年6月12日
深度多模态表示学习综述论文,22页pdf
专知
32+阅读 · 2020年6月21日
关于GANs在医学图像领域应用的总结
人工智能前沿讲习班
31+阅读 · 2019年6月4日
CNN已老,GNN来了!清华大学孙茂松组一文综述GNN
学界 | 综述论文:四大类深度迁移学习
机器之心
17+阅读 · 2018年9月15日
深度 | 迁移学习全面概述:从基本概念到相关研究
七月在线实验室
15+阅读 · 2017年8月15日
Arxiv
0+阅读 · 2021年1月23日
Arxiv
19+阅读 · 2021年1月14日
Few-shot Learning: A Survey
Arxiv
363+阅读 · 2019年4月10日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
16+阅读 · 2018年2月7日
Arxiv
5+阅读 · 2017年11月30日
VIP会员
相关VIP内容
最新《监督机器学习可解释性》2020大综述论文,74页pdf
专知会员服务
130+阅读 · 2020年11月19日
最新《对比监督学习》综述论文,20页pdf
专知会员服务
85+阅读 · 2020年11月5日
最新《低资源自然语言处理》综述论文,21页pdf
专知会员服务
60+阅读 · 2020年10月27日
专知会员服务
65+阅读 · 2020年9月10日
最新《深度持续学习》综述论文,32页pdf
专知会员服务
182+阅读 · 2020年9月7日
西北大学等最新《深度主动学习》全面综述论文,30页pdf
专知会员服务
101+阅读 · 2020年7月20日
最新《深度半监督学习》综述论文,43页pdf
专知会员服务
156+阅读 · 2020年6月12日
相关论文
Top
微信扫码咨询专知VIP会员