Binary classifiers trained on a certain proportion of positive items introduce a bias when applied to data sets with different proportions of positive items. Most solutions for dealing with this issue assume that some information on the latter distribution is known. However, this is not always the case, certainly when this proportion is the target variable. In this paper a maximum likelihood estimator for the true proportion of positives in data sets is suggested and tested on synthetic and real world data.


翻译:就一定比例的正值项目接受过培训的二分位分类人员在对不同比例的正值项目数据集适用时会引入偏差,处理该问题的多数解决办法假定已经知道关于后一种分布的某些信息,但情况并非总是如此,当然当该比例是目标变量时也是如此。本文建议并用合成和真实世界数据测试数据集正值真实比例的最大可能性估计值。

0
下载
关闭预览

相关内容

商业数据分析,39页ppt
专知会员服务
157+阅读 · 2020年6月2日
知识图谱在可解释人工智能中的作用,附81页ppt
专知会员服务
136+阅读 · 2019年11月11日
强化学习最新教程,17页pdf
专知会员服务
167+阅读 · 2019年10月11日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
39+阅读 · 2019年10月9日
已删除
将门创投
3+阅读 · 2018年6月20日
Implicit Maximum Likelihood Estimation
Arxiv
7+阅读 · 2018年9月24日
Arxiv
9+阅读 · 2018年3月28日
VIP会员
相关资讯
已删除
将门创投
3+阅读 · 2018年6月20日
Top
微信扫码咨询专知VIP会员