干货|训练集、验证集和测试集的意义

2017 年 10 月 15 日 机器学习研究会

在有监督的机器学习中,经常会说到训练集(train)、验证集(validation)和测试集(test),这三个集合的区分可能会让人糊涂,特别是,有些读者搞不清楚验证集和测试集有什么区别。


1
划分



如果我们自己已经有了一个大的标注数据集,想要完成一个有监督模型的测试,那么通常使用均匀随机抽样的方式,将数据集划分为训练集、验证集、测试集,这三个集合不能有交集,常见的比例是8:1:1,当然比例是人为的。从这个角度来看,三个集合都是同分布的。

如果是做比赛,官方只提供了一个标注的数据集(作为训练集)以及一个没有标注的测试集,那么我们做模型的时候,通常会人工从训练集中划分一个验证集出来。

这时候我们通常不再划分一个测试集,可能的原因有两个:1、比赛方基本都很抠,训练集的样本本来就少;2、我们也没法保证要提交的测试集是否跟训练集完全同分布,因此再划分一个跟训练集同分布的测试集就没多大意义了。


2
 参数



有了模型后,训练集就是用来训练参数的,说准确点,一般是用来梯度下降的。而验证集基本是在每个epoch完成后,用来测试一下当前模型的准确率。因为验证集跟训练集没有交集,因此这个准确率是可靠的。那么为啥还需要一个测试集呢?

这就需要区分一下模型的各种参数了。事实上,对于一个模型来说,其参数可以分为普通参数超参数。在不引入强化学习的前提下,那么普通参数就是可以被梯度下降所更新的,也就是训练集所更新的参数。

另外,还有超参数的概念,比如网络层数、网络节点数、迭代次数、学习率等等,这些参数不在梯度下降的更新范围内。尽管现在已经有一些算法可以用来搜索模型的超参数,但多数情况下我们还是自己人工根据验证集来调。


转自:机器学习算法与自然语言处理


完整内容请点击“阅读原文”

登录查看更多
3

相关内容

注意力图神经网络的多标签文本分类
专知会员服务
111+阅读 · 2020年3月28日
【浙江大学】对抗样本生成技术综述
专知会员服务
91+阅读 · 2020年1月6日
干货实践 | 计算机视觉花卉识别模型(代码分享)
计算机视觉战队
10+阅读 · 2019年3月13日
干货——图像分类(下)
计算机视觉战队
14+阅读 · 2018年8月28日
【干货】监督学习与无监督学习简介
专知
14+阅读 · 2018年4月4日
面试整理:关于代价函数,正则化
数据挖掘入门与实战
8+阅读 · 2018年3月29日
干货 | 一文搞懂极大似然估计
AI100
7+阅读 · 2017年12月3日
机器学习(26)之K-Means实战与调优详解
机器学习算法与Python学习
4+阅读 · 2017年11月19日
为什么『无监督集成学习』乏人问津?
AI研习社
10+阅读 · 2017年10月24日
[学习] 这些深度学习网络调参技巧,你了解吗?
菜鸟的机器学习
7+阅读 · 2017年7月30日
机器学习算法比较
我爱机器学习
4+阅读 · 2016年12月11日
Question Generation by Transformers
Arxiv
5+阅读 · 2019年9月14日
Star-Transformer
Arxiv
5+阅读 · 2019年2月28日
Arxiv
14+阅读 · 2018年5月15日
Arxiv
5+阅读 · 2018年4月22日
Arxiv
6+阅读 · 2018年3月28日
VIP会员
相关资讯
干货实践 | 计算机视觉花卉识别模型(代码分享)
计算机视觉战队
10+阅读 · 2019年3月13日
干货——图像分类(下)
计算机视觉战队
14+阅读 · 2018年8月28日
【干货】监督学习与无监督学习简介
专知
14+阅读 · 2018年4月4日
面试整理:关于代价函数,正则化
数据挖掘入门与实战
8+阅读 · 2018年3月29日
干货 | 一文搞懂极大似然估计
AI100
7+阅读 · 2017年12月3日
机器学习(26)之K-Means实战与调优详解
机器学习算法与Python学习
4+阅读 · 2017年11月19日
为什么『无监督集成学习』乏人问津?
AI研习社
10+阅读 · 2017年10月24日
[学习] 这些深度学习网络调参技巧,你了解吗?
菜鸟的机器学习
7+阅读 · 2017年7月30日
机器学习算法比较
我爱机器学习
4+阅读 · 2016年12月11日
相关论文
Question Generation by Transformers
Arxiv
5+阅读 · 2019年9月14日
Star-Transformer
Arxiv
5+阅读 · 2019年2月28日
Arxiv
14+阅读 · 2018年5月15日
Arxiv
5+阅读 · 2018年4月22日
Arxiv
6+阅读 · 2018年3月28日
Top
微信扫码咨询专知VIP会员