机器学习的科学进步是由评估模型相对质量的实证研究推动的。这种评估的目标是比较机器学习方法本身,而不是对训练模型的特定优化实例进行单一测试集评估。由于深度学习模型的性能依赖于各种随机性来源,仅报告单个最佳模型的性能评分的做法尤其不适用于深度学习。这样的评估实践提出了方法论上的问题:一个模型是否预测了它声称预测的东西(有效性),一个模型的表现在训练过程的重复中是否一致(可靠性),以及两个模型之间的表现差异是否由于机会(显著性)。本教程的目标是通过具体的统计测试来回答这些问题。该教程是实践性的,并配有教科书(Riezler和Hagmann, 2021年)和一个包含R和Python代码的网页。

成为VIP会员查看完整内容
14

相关内容

国际机器学习大会(International Conference on Machine Learning,简称ICML ) 是由国际机器学习学会(IMLS)主办的机器学习国际顶级会议,也是CCF-A类学术会议。ICML 2022 共收到5630 投稿,接收1117 篇 short oral,118篇 long oral,录用率为21.94%。
【KDD2022教程】Transformers多模态数据分类,41页ppt
专知会员服务
84+阅读 · 2022年8月18日
【ICML2022】因果Transformer:估算反事实结果的因果, 附ppt
专知会员服务
74+阅读 · 2022年7月20日
《机器学习的最优传输》教程,63页PPT
专知会员服务
61+阅读 · 2022年4月30日
专知会员服务
238+阅读 · 2021年10月8日
一份简单《图神经网络》教程,28页ppt
专知会员服务
120+阅读 · 2020年8月2日
【ICML2020】基于模型的强化学习方法教程,279页ppt
专知会员服务
123+阅读 · 2020年7月20日
IJCAI2022《对抗序列决策》教程,164页ppt
专知
4+阅读 · 2022年7月27日
【ICML2022教程】智能交互式学习,80页ppt
专知
0+阅读 · 2022年7月22日
【ICML2022教程】因果公平性分析,68页ppt
专知
2+阅读 · 2022年7月19日
深度学习中的“不确定性基线”
TensorFlow
5+阅读 · 2021年12月7日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Arxiv
0+阅读 · 2022年9月13日
A Survey on Bayesian Deep Learning
Arxiv
60+阅读 · 2020年7月2日
VIP会员
相关VIP内容
【KDD2022教程】Transformers多模态数据分类,41页ppt
专知会员服务
84+阅读 · 2022年8月18日
【ICML2022】因果Transformer:估算反事实结果的因果, 附ppt
专知会员服务
74+阅读 · 2022年7月20日
《机器学习的最优传输》教程,63页PPT
专知会员服务
61+阅读 · 2022年4月30日
专知会员服务
238+阅读 · 2021年10月8日
一份简单《图神经网络》教程,28页ppt
专知会员服务
120+阅读 · 2020年8月2日
【ICML2020】基于模型的强化学习方法教程,279页ppt
专知会员服务
123+阅读 · 2020年7月20日
相关基金
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
7+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
微信扫码咨询专知VIP会员