这项工作在经典的数据不平衡问题下,探索了非常实际但极少被研究的问题:数据不平衡回归问题。现有的处理不平衡数据/长尾分布的方法绝大多数仅针对分类问题,即目标值是不同类别的离散值(索引);但是,许多实际的任务涉及连续的,甚至有时是无限多的目标值。本文推广了传统不平衡分类问题的范式,将数据不平衡问题从离散值域推广到连续域。

我们不仅提出了两种简单有效的方法去提升不平衡回归问题上的模型表现,也建立了五个新的benchmark DIR数据集,涵盖了计算机视觉,自然语言处理,和医疗问题上的不平衡回归任务。目前代码,数据,和模型已经在GitHub上开源:

https://github.com/YyzHarry/imbalanced-regression

那么开篇首先用概括一下本文的主要贡献:

我们提出了一个新的任务,称为深度不平衡回归(Deep Imbalanced Regression,简写为DIR)。DIR任务定义为从具有连续目标的不平衡数据中学习,并能泛化到整个目标范围;

我们同时提出了针对不平衡回归的新的方法,标签分布平滑(label distribution smoothing, LDS)和特征分布平滑(feature distribution smoothing, FDS),以解决具有连续目标的不平衡数据的学习问题;

最后我们建立了五个新的DIR数据集,涵盖了computer vision,NLP,和healthcare上的不平衡回归任务,来方便未来在不平衡数据上的研究。

接下来我们进入正文。按照惯例,我会先抛开文章本身,大体梳理一下数据不平衡这个问题在分类以及回归上的一部分研究现状,在此基础上尽量详细的介绍我们的思路和方法,省去不必要的细节。

成为VIP会员查看完整内容
36

相关内容

专知会员服务
113+阅读 · 2021年7月24日
专知会员服务
74+阅读 · 2021年7月21日
专知会员服务
36+阅读 · 2021年7月17日
专知会员服务
24+阅读 · 2021年7月11日
专知会员服务
11+阅读 · 2021年7月4日
专知会员服务
91+阅读 · 2021年6月3日
专知会员服务
80+阅读 · 2021年5月10日
领域自适应研究综述
专知会员服务
53+阅读 · 2021年5月5日
自监督学习最新研究进展
专知会员服务
76+阅读 · 2021年3月24日
专知会员服务
53+阅读 · 2020年3月16日
【机器学习】一文读懂线性回归、岭回归和Lasso回归
人工智能头条
6+阅读 · 2019年10月22日
CVPR 2019:精确目标检测的不确定边界框回归
AI科技评论
13+阅读 · 2019年9月16日
非平衡数据集 focal loss 多类分类
AI研习社
33+阅读 · 2019年4月23日
数据分析师应该知道的16种回归方法:负二项回归
数萃大数据
72+阅读 · 2018年9月16日
深入广义线性模型:分类和回归
专知
4+阅读 · 2018年2月14日
解决机器学习问题有通法!看这一篇就够了!
大数据文摘
4+阅读 · 2017年9月18日
开发 | 如何解决机器学习中的数据不平衡问题?
AI科技评论
5+阅读 · 2017年6月13日
Arxiv
0+阅读 · 2021年7月28日
Arxiv
0+阅读 · 2021年7月26日
Arxiv
14+阅读 · 2021年3月10日
Universal Transformers
Arxiv
5+阅读 · 2019年3月5日
Arxiv
4+阅读 · 2018年9月11日
Arxiv
10+阅读 · 2018年3月23日
VIP会员
相关主题
相关VIP内容
专知会员服务
113+阅读 · 2021年7月24日
专知会员服务
74+阅读 · 2021年7月21日
专知会员服务
36+阅读 · 2021年7月17日
专知会员服务
24+阅读 · 2021年7月11日
专知会员服务
11+阅读 · 2021年7月4日
专知会员服务
91+阅读 · 2021年6月3日
专知会员服务
80+阅读 · 2021年5月10日
领域自适应研究综述
专知会员服务
53+阅读 · 2021年5月5日
自监督学习最新研究进展
专知会员服务
76+阅读 · 2021年3月24日
专知会员服务
53+阅读 · 2020年3月16日
相关资讯
【机器学习】一文读懂线性回归、岭回归和Lasso回归
人工智能头条
6+阅读 · 2019年10月22日
CVPR 2019:精确目标检测的不确定边界框回归
AI科技评论
13+阅读 · 2019年9月16日
非平衡数据集 focal loss 多类分类
AI研习社
33+阅读 · 2019年4月23日
数据分析师应该知道的16种回归方法:负二项回归
数萃大数据
72+阅读 · 2018年9月16日
深入广义线性模型:分类和回归
专知
4+阅读 · 2018年2月14日
解决机器学习问题有通法!看这一篇就够了!
大数据文摘
4+阅读 · 2017年9月18日
开发 | 如何解决机器学习中的数据不平衡问题?
AI科技评论
5+阅读 · 2017年6月13日
微信扫码咨询专知VIP会员