【ICML2021】利用最大化证据作为准则的预训练模型选择判据 - 专知

会员服务 ·

0

【ICML2021】利用最大化证据作为准则的预训练模型选择判据

2021 年 5 月 16 日 专知

本文研究了任务自适应预训练模型的选择问题，这是一个有待探讨的问题，即如何评估预训练模型，以便在不进行微调的情况下从模型族中选择适合任务的模型。一项试点工作(Nguyen等人，2020年)解决了将有监督的预训练模型转移到分类任务中的问题，但它不能处理新兴的无监督的预训练模型或回归任务。

为了寻求一种实用的评估方法，我们提出了估计标签的最大证据(边缘似然)，在给定预先训练模型提取的特征。与似然值相比，最大证据值不容易出现过拟合，而且通过我们精心设计的算法可以大大减少昂贵的计算量。最大证据对数(LogME)可以用来评估迁移学习的预训练模型:LogME高的预训练模型可能具有良好的迁移性能。LogME具有快速、准确、通用的特点，是第一个实用的迁移学习评估方法。相对于蛮力微调，LogME在时间上带来了超过3000倍的加速。它在设置上比以前的方法有很大的优势，并且适用于以前的方法不能处理的新设置。它对于不同的预训练模型(有监督的预训练和无监督的预训练)、下游任务(分类和回归)和模式(视觉和语言)来说是足够普遍的。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“LME” 就可以获取《【ICML2021】利用最大化证据作为准则的预训练模型选择判据》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

1

相关内容

预训练模型

预训练模型

预训练模型是深度学习架构，已经过训练以执行大量数据上的特定任务（例如，识别图片中的分类问题）。这种训练不容易执行，并且通常需要大量资源，超出许多可用于深度学习模型的人可用的资源。

【NeurIPS2021】利用预训练对比表示征的逆问题

专知会员服务

10+阅读 · 2021年10月17日

【ICML2021】具有局部和全局的自监督图表示学习

专知会员服务

32+阅读 · 2021年8月7日

【KDD2021】图神经网络的自适应迁移学习

专知会员服务

66+阅读 · 2021年7月25日

【ICML2021】双加速的快速间隔最大化

专知会员服务

12+阅读 · 2021年7月4日

【CVPR2021】深度稳定学习分布外泛化

专知会员服务

30+阅读 · 2021年5月20日

【ICML2021】有向图网络

专知会员服务

82+阅读 · 2021年5月10日

【CVPR2021】半监督迁移学习的自适应一致性正则化

专知会员服务

33+阅读 · 2021年3月7日

清华大学等首篇「动态神经网络」最新综述论文，20页pdf236篇文献

清华大学等首篇「动态神经网络」最新综述论文，20页pdf236篇文献

专知会员服务

80+阅读 · 2021年2月21日

小米在预训练模型的探索与优化

小米在预训练模型的探索与优化

专知会员服务

20+阅读 · 2020年12月31日

【NeurIPS 2020-Hinton论文】大型自监督模型是强有力的半监督学习器

【NeurIPS 2020-Hinton论文】大型自监督模型是强有力的半监督学习器

专知会员服务

25+阅读 · 2020年11月4日

【ICML2021】低秩Sinkhorn 分解

【ICML2021】低秩Sinkhorn 分解

专知

9+阅读 · 2021年8月20日

【ICML2021】因果匹配领域泛化

【ICML2021】因果匹配领域泛化

专知

12+阅读 · 2021年8月12日

【CVPR2021】半监督迁移学习的自适应一致性正则化

【CVPR2021】半监督迁移学习的自适应一致性正则化

专知

41+阅读 · 2021年3月7日

【NeurIPS2020 】数据扩充的图对比学习

【NeurIPS2020 】数据扩充的图对比学习

专知

9+阅读 · 2020年11月9日

【NeurIPS2020】无限可能的联合对比学习

【NeurIPS2020】无限可能的联合对比学习

专知

3+阅读 · 2020年10月2日

【NeurIPS2020】点针图网络，Pointer Graph Networks

【NeurIPS2020】点针图网络，Pointer Graph Networks

专知

9+阅读 · 2020年9月27日

图神经网络架构，稳定性，可迁移性

图神经网络架构，稳定性，可迁移性

专知

5+阅读 · 2020年8月8日

【KDD2020】图神经网络生成式预训练

【KDD2020】图神经网络生成式预训练

专知

22+阅读 · 2020年7月3日

【IJCV2020】通过迭代亲密学习实现弱监督语义分割

【IJCV2020】通过迭代亲密学习实现弱监督语义分割

专知

6+阅读 · 2020年2月20日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

12+阅读 · 2020年2月12日

Satellite galaxy abundance dependency on cosmology in Magneticum simulations

Arxiv

0+阅读 · 2021年10月11日

Masked Language Modeling and the Distributional Hypothesis: Order Word Matters Pre-training for Little

Arxiv

0+阅读 · 2021年9月9日

AID: Efficient Prediction of Aggregated Intensity of Dependency in Large-scale Cloud Systems

Arxiv

0+阅读 · 2021年8月20日

Uncertainty-Aware Reliable Text Classification

Arxiv

8+阅读 · 2021年7月15日

SiT: Self-supervised vIsion Transformer

Arxiv

19+阅读 · 2021年4月8日

GAN Inversion: A Survey

Arxiv

19+阅读 · 2021年1月14日

Real-Time High-Resolution Background Matting

Real-Time High-Resolution Background Matting

Arxiv

4+阅读 · 2020年12月14日

BERT has a Mouth, and It Must Speak: BERT as a Markov Random Field Language Model

Arxiv

3+阅读 · 2019年2月11日

ConceptNet 5.5: An Open Multilingual Graph of General Knowledge

ConceptNet 5.5: An Open Multilingual Graph of General Knowledge

Arxiv

10+阅读 · 2018年12月11日

DeSIGN: Design Inspiration from Generative Networks

Arxiv

3+阅读 · 2018年4月3日

VIP会员

相关主题

预训练模型

相关VIP内容

【NeurIPS2021】利用预训练对比表示征的逆问题

专知会员服务

10+阅读 · 2021年10月17日

【ICML2021】具有局部和全局的自监督图表示学习

专知会员服务

32+阅读 · 2021年8月7日

【KDD2021】图神经网络的自适应迁移学习

专知会员服务

66+阅读 · 2021年7月25日

【ICML2021】双加速的快速间隔最大化

专知会员服务

12+阅读 · 2021年7月4日

【CVPR2021】深度稳定学习分布外泛化

专知会员服务

30+阅读 · 2021年5月20日

【ICML2021】有向图网络

专知会员服务

82+阅读 · 2021年5月10日

【CVPR2021】半监督迁移学习的自适应一致性正则化

专知会员服务

33+阅读 · 2021年3月7日

清华大学等首篇「动态神经网络」最新综述论文，20页pdf236篇文献

清华大学等首篇「动态神经网络」最新综述论文，20页pdf236篇文献

专知会员服务

80+阅读 · 2021年2月21日

小米在预训练模型的探索与优化

小米在预训练模型的探索与优化

专知会员服务

20+阅读 · 2020年12月31日

【NeurIPS 2020-Hinton论文】大型自监督模型是强有力的半监督学习器

【NeurIPS 2020-Hinton论文】大型自监督模型是强有力的半监督学习器

专知会员服务

25+阅读 · 2020年11月4日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】数据驱动决策中的激励、信息与不确定性

DGP双粒度提示框架：图增强大模型助力欺诈检测

【ICCV2025】ESSENTIAL：用于视频类增量学习的情景记忆与语义记忆整合

唯快不破：大型语言模型高效架构综述

相关资讯

【ICML2021】低秩Sinkhorn 分解

【ICML2021】低秩Sinkhorn 分解

专知

9+阅读 · 2021年8月20日

【ICML2021】因果匹配领域泛化

【ICML2021】因果匹配领域泛化

专知

12+阅读 · 2021年8月12日

【CVPR2021】半监督迁移学习的自适应一致性正则化

【CVPR2021】半监督迁移学习的自适应一致性正则化

专知

41+阅读 · 2021年3月7日

【NeurIPS2020 】数据扩充的图对比学习

【NeurIPS2020 】数据扩充的图对比学习

专知

9+阅读 · 2020年11月9日

【NeurIPS2020】无限可能的联合对比学习

【NeurIPS2020】无限可能的联合对比学习

专知

3+阅读 · 2020年10月2日

【NeurIPS2020】点针图网络，Pointer Graph Networks

【NeurIPS2020】点针图网络，Pointer Graph Networks

专知

9+阅读 · 2020年9月27日

图神经网络架构，稳定性，可迁移性

图神经网络架构，稳定性，可迁移性

专知

5+阅读 · 2020年8月8日

【KDD2020】图神经网络生成式预训练

【KDD2020】图神经网络生成式预训练

专知

22+阅读 · 2020年7月3日

【IJCV2020】通过迭代亲密学习实现弱监督语义分割

【IJCV2020】通过迭代亲密学习实现弱监督语义分割

专知

6+阅读 · 2020年2月20日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

12+阅读 · 2020年2月12日

相关论文

Satellite galaxy abundance dependency on cosmology in Magneticum simulations

Arxiv

0+阅读 · 2021年10月11日

Masked Language Modeling and the Distributional Hypothesis: Order Word Matters Pre-training for Little

Arxiv

0+阅读 · 2021年9月9日

AID: Efficient Prediction of Aggregated Intensity of Dependency in Large-scale Cloud Systems

Arxiv

0+阅读 · 2021年8月20日

Uncertainty-Aware Reliable Text Classification

Arxiv

8+阅读 · 2021年7月15日

SiT: Self-supervised vIsion Transformer

Arxiv

19+阅读 · 2021年4月8日

GAN Inversion: A Survey

Arxiv

19+阅读 · 2021年1月14日

Real-Time High-Resolution Background Matting

Real-Time High-Resolution Background Matting

Arxiv

4+阅读 · 2020年12月14日

BERT has a Mouth, and It Must Speak: BERT as a Markov Random Field Language Model

Arxiv

3+阅读 · 2019年2月11日

ConceptNet 5.5: An Open Multilingual Graph of General Knowledge

ConceptNet 5.5: An Open Multilingual Graph of General Knowledge

Arxiv

10+阅读 · 2018年12月11日

DeSIGN: Design Inspiration from Generative Networks

Arxiv

3+阅读 · 2018年4月3日

大家都在搜

CMU博士论文

无人机集群

久别重逢话双塔

OpenKG开源系列 | 海洋鱼类百科知识图谱（浙江大学）

微信扫码咨询专知VIP会员