The generalization error of a classifier is related to the complexity of the set of functions among which the classifier is chosen. Roughly speaking, the more complex the family, the greater the potential disparity between the training error and the population error of the classifier. This principle is embodied in layman's terms by Occam's razor principle, which suggests favoring low-complexity hypotheses over complex ones. We study a family of low-complexity classifiers consisting of thresholding the one-dimensional feature obtained by projecting the data on a random line after embedding it into a higher dimensional space parametrized by monomials of order up to k. More specifically, the extended data is projected n-times and the best classifier among those n (based on its performance on training data) is chosen. We obtain a bound on the generalization error of these low-complexity classifiers. The bound is less than that of any classifier with a non-trivial VC dimension, and thus less than that of a linear classifier. We also show that, given full knowledge of the class conditional densities, the error of the classifiers would converge to the optimal (Bayes) error as k and n go to infinity; if only a training dataset is given, we show that the classifiers will perfectly classify all the training points as k and n go to infinity.


翻译:分类器的普遍错误与选择分类器所在的一组功能的复杂性有关。 粗略地说, 家庭越复杂, 培训错误与分类器人口错误之间的潜在差异越大。 这一原则由Occam的剃刀原则体现在外人术语中, 这表示偏向于低复杂假设而非复杂假设。 我们研究的是低复杂分类的组合, 由在随机线上投射数据, 将数据嵌入一个更高维度的空间, 以单向 k。 更具体地说, 扩展数据是预测n- 时间, 并且选择了这些n( 根据其培训数据的性能) 中的最佳分类器。 我们从这些低复杂分类器的一般错误中获得了约束。 我们的研究范围小于任何非初始 VC 尺寸的分类器, 因而比线性分类器的大小要小。 我们还表明, 如果完全了解了班级的精确度和精确级级的分类方法, 只有当我们作为最精确级级级级级级级级级的训练者才具备最精确的精确性, 我们的分类方法才能将显示最精确性级级级级级级级级级级级的分类。

0
下载
关闭预览

相关内容

学习方法的泛化能力(Generalization Error)是由该方法学习到的模型对未知数据的预测能力,是学习方法本质上重要的性质。现实中采用最多的办法是通过测试泛化误差来评价学习方法的泛化能力。泛化误差界刻画了学习算法的经验风险与期望风险之间偏差和收敛速度。一个机器学习的泛化误差(Generalization Error),是一个描述学生机器在从样品数据中学习之后,离教师机器之间的差距的函数。
专知会员服务
22+阅读 · 2021年6月28日
【经典书】计算理论导论,482页pdf
专知会员服务
85+阅读 · 2021年4月10日
专知会员服务
144+阅读 · 2021年3月17日
专知会员服务
51+阅读 · 2020年12月14日
应用机器学习书稿,361页pdf
专知会员服务
59+阅读 · 2020年11月24日
专知会员服务
162+阅读 · 2020年1月16日
强化学习最新教程,17页pdf
专知会员服务
177+阅读 · 2019年10月11日
图机器学习 2.2-2.4 Properties of Networks, Random Graph
图与推荐
10+阅读 · 2020年3月28日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
条件GAN重大改进!cGANs with Projection Discriminator
CreateAMind
8+阅读 · 2018年2月7日
已删除
将门创投
4+阅读 · 2017年12月12日
【学习】(Python)SVM数据分类
机器学习研究会
6+阅读 · 2017年10月15日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Arxiv
0+阅读 · 2021年10月12日
Arxiv
0+阅读 · 2021年10月11日
VIP会员
相关VIP内容
专知会员服务
22+阅读 · 2021年6月28日
【经典书】计算理论导论,482页pdf
专知会员服务
85+阅读 · 2021年4月10日
专知会员服务
144+阅读 · 2021年3月17日
专知会员服务
51+阅读 · 2020年12月14日
应用机器学习书稿,361页pdf
专知会员服务
59+阅读 · 2020年11月24日
专知会员服务
162+阅读 · 2020年1月16日
强化学习最新教程,17页pdf
专知会员服务
177+阅读 · 2019年10月11日
相关资讯
图机器学习 2.2-2.4 Properties of Networks, Random Graph
图与推荐
10+阅读 · 2020年3月28日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
条件GAN重大改进!cGANs with Projection Discriminator
CreateAMind
8+阅读 · 2018年2月7日
已删除
将门创投
4+阅读 · 2017年12月12日
【学习】(Python)SVM数据分类
机器学习研究会
6+阅读 · 2017年10月15日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员