【ICML2022】序列决策的效用理论

2022 年 6 月 30 日 专知


大型基于Transformer的模型在各种自然语言处理和计算机视觉任务中表现出优越的性能。然而,这些模型包含大量的参数,这限制了它们在真实应用中的部署。为了减少模型的大小,研究人员根据权重的重要性评分对这些模型进行修剪。然而,这些分数通常是在训练过程中的小批量估计,由于小批量抽样和复杂的训练动态,这带来了很大的可变性/不确定性。由于这种不确定性,常用的修剪方法会对一些关键权重进行修剪,使得训练不稳定,不利于泛化。为了解决这一问题,我们提出了PLATON算法,该算法通过重要性估计的置信上限(upper confidence bound, UCB)来捕捉重要性得分的不确定性。特别是对于重要性得分低但不确定性高的权重,PLATON倾向于保留它们并探索它们的容量。我们在自然语言理解、问题回答和图像分类等多个基于transformer的模型上进行了大量实验,以验证PLATON的有效性。结果表明,在不同的稀疏度水平下,PLATON算法均有显著的改进。

https://arxiv.org/abs/2206.12562


专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“PLON” 就可以获取【ICML2022】序列决策的效用理论》专知下载链接

                       
专知,专业可信的人工智能知识分发 ,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取100000+AI(AI与军事、医药、公安等)主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取100000+AI主题知识资料
登录查看更多
1

相关内容

【ICML2022】在线决策Transformer
专知会员服务
33+阅读 · 2022年7月27日
【ICML2022】基于树的集合的鲁棒反事实解释
专知会员服务
14+阅读 · 2022年7月7日
【ICML2022】GALAXY:极化图主动学习
专知会员服务
30+阅读 · 2022年6月12日
专知会员服务
15+阅读 · 2021年9月15日
专知会员服务
16+阅读 · 2021年8月6日
专知会员服务
42+阅读 · 2021年7月1日
专知会员服务
24+阅读 · 2021年6月15日
专知会员服务
38+阅读 · 2021年6月11日
专知会员服务
81+阅读 · 2021年5月10日
[ICML2020]层次间消息传递的分子图学习
专知会员服务
33+阅读 · 2020年6月27日
【ICML2022】时序自监督视频transformer
专知
1+阅读 · 2022年7月28日
【ICML2022】在线决策Transformer
专知
2+阅读 · 2022年7月27日
【ICML2022】通过能量最小化学习迭代推理
【ICML2022】GALAXY:极化图主动学习
专知
2+阅读 · 2022年6月12日
【ICML2022】可解释的心理学理论
专知
3+阅读 · 2022年5月29日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
4+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年9月12日
Arxiv
23+阅读 · 2022年2月24日
VIP会员
相关VIP内容
【ICML2022】在线决策Transformer
专知会员服务
33+阅读 · 2022年7月27日
【ICML2022】基于树的集合的鲁棒反事实解释
专知会员服务
14+阅读 · 2022年7月7日
【ICML2022】GALAXY:极化图主动学习
专知会员服务
30+阅读 · 2022年6月12日
专知会员服务
15+阅读 · 2021年9月15日
专知会员服务
16+阅读 · 2021年8月6日
专知会员服务
42+阅读 · 2021年7月1日
专知会员服务
24+阅读 · 2021年6月15日
专知会员服务
38+阅读 · 2021年6月11日
专知会员服务
81+阅读 · 2021年5月10日
[ICML2020]层次间消息传递的分子图学习
专知会员服务
33+阅读 · 2020年6月27日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
4+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员