This paper aims to provide understandings for the effect of an over-parameterized model, e.g. a deep neural network, memorizing instance-dependent noisy labels. We first quantify the harms caused by memorizing noisy instances, and show the disparate impacts of noisy labels for sample instances with different representation frequencies. We then analyze how several popular solutions for learning with noisy labels mitigate this harm at the instance level. Our analysis reveals that existing approaches lead to disparate treatments when handling noisy instances. While higher-frequency instances often enjoy a high probability of an improvement by applying these solutions, lower-frequency instances do not. Our analysis reveals new understandings for when these approaches work, and provides theoretical justifications for previously reported empirical observations. This observation requires us to rethink the distribution of label noise across instances and calls for different treatments for instances in different regimes.


翻译:本文旨在提供对过度参数化模型影响的理解,例如深神经网络、记忆以实例为依存的吵闹标签。 我们首先量化由记忆噪音事件造成的伤害,并用不同代表频率来显示噪音标签对抽样案例的不同影响。 然后我们分析用噪音标签学习的几种流行解决方案如何在实例一级减轻这种伤害。 我们的分析显示,在处理吵闹事件时,现有方法导致不同的治疗。 高频案例往往通过应用这些解决方案而有很大的改进可能性,但低频率案例却并非如此。 我们的分析揭示了这些方法发挥作用时的新理解,并为先前报告的经验性观察提供了理论依据。 观察要求我们重新考虑标签噪音在不同案例中的分布,并要求在不同制度中的不同情况下采用不同的处理方法。

1
下载
关闭预览

相关内容

专知会员服务
51+阅读 · 2021年8月8日
【经典书】线性代数,286页pdf
专知会员服务
130+阅读 · 2021年2月28日
最新《自监督表示学习》报告,70页ppt
专知会员服务
86+阅读 · 2020年12月22日
专知会员服务
44+阅读 · 2020年12月18日
因果图,Causal Graphs,52页ppt
专知会员服务
248+阅读 · 2020年4月19日
【干货书】真实机器学习,264页pdf,Real-World Machine Learning
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
28+阅读 · 2019年5月18日
逆强化学习-学习人先验的动机
CreateAMind
16+阅读 · 2019年1月18日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
已删除
将门创投
7+阅读 · 2018年8月28日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
【论文】图上的表示学习综述
机器学习研究会
14+阅读 · 2017年9月24日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Arxiv
0+阅读 · 2021年9月11日
Arxiv
5+阅读 · 2019年6月5日
VIP会员
相关VIP内容
专知会员服务
51+阅读 · 2021年8月8日
【经典书】线性代数,286页pdf
专知会员服务
130+阅读 · 2021年2月28日
最新《自监督表示学习》报告,70页ppt
专知会员服务
86+阅读 · 2020年12月22日
专知会员服务
44+阅读 · 2020年12月18日
因果图,Causal Graphs,52页ppt
专知会员服务
248+阅读 · 2020年4月19日
【干货书】真实机器学习,264页pdf,Real-World Machine Learning
相关资讯
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
28+阅读 · 2019年5月18日
逆强化学习-学习人先验的动机
CreateAMind
16+阅读 · 2019年1月18日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
已删除
将门创投
7+阅读 · 2018年8月28日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
【论文】图上的表示学习综述
机器学习研究会
14+阅读 · 2017年9月24日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员