【ICML2022】序列决策的效用理论 - 专知VIP

会员服务 ·

6

ICML 2022 · 序列决策 · Transformer ·

2022 年 6 月 30 日

【ICML2022】序列决策的效用理论

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

大型基于Transformer的模型在各种自然语言处理和计算机视觉任务中表现出优越的性能。然而，这些模型包含大量的参数，这限制了它们在真实应用中的部署。为了减少模型的大小，研究人员根据权重的重要性评分对这些模型进行修剪。然而，这些分数通常是在训练过程中的小批量估计，由于小批量抽样和复杂的训练动态，这带来了很大的可变性/不确定性。由于这种不确定性，常用的修剪方法会对一些关键权重进行修剪，使得训练不稳定，不利于泛化。为了解决这一问题，我们提出了PLATON算法，该算法通过重要性估计的置信上限(upper confidence bound, UCB)来捕捉重要性得分的不确定性。特别是对于重要性得分低但不确定性高的权重，PLATON倾向于保留它们并探索它们的容量。我们在自然语言理解、问题回答和图像分类等多个基于transformer的模型上进行了大量实验，以验证PLATON的有效性。结果表明，在不同的稀疏度水平下，PLATON算法均有显著的改进。 https://arxiv.org/abs/2206.12562

成为VIP会员查看完整内容

16

相关内容

ICML 2022

国际机器学习大会(International Conference on Machine Learning，简称ICML ) 是由国际机器学习学会（IMLS）主办的机器学习国际顶级会议，也是CCF-A类学术会议。ICML 2022 共收到5630 投稿，接收1117 篇 short oral，118篇 long oral，录用率为21.94%。

【ICML2022】在线决策Transformer

【ICML2022】在线决策Transformer

专知会员服务

34+阅读 · 2022年7月27日

【ICML2022】因果Transformer:估算反事实结果的因果, 附ppt

【ICML2022】因果Transformer:估算反事实结果的因果, 附ppt

专知会员服务

83+阅读 · 2022年7月20日

【CMU博士论文】现代深度学习的均衡(Equilibrium)方法，155页pdf

【CMU博士论文】现代深度学习的均衡(Equilibrium)方法，155页pdf

专知会员服务

37+阅读 · 2022年6月16日

【ICML2022】鲁棒强化学习的策略梯度法

【ICML2022】鲁棒强化学习的策略梯度法

专知会员服务

38+阅读 · 2022年5月21日

【ICML2021】逆约束强化学习

专知会员服务

33+阅读 · 2021年9月7日

【ICML2021】密度约束强化学习

专知会员服务

22+阅读 · 2021年6月26日

【ICML2021】策略梯度贝叶斯鲁棒优化的模仿学习

专知会员服务

25+阅读 · 2021年6月15日

【ICML2021】数据表示的几何评估

专知会员服务

38+阅读 · 2021年6月3日

【ICML2021】数据高效深度学习的自调优

专知会员服务

22+阅读 · 2021年5月14日

【ICML2021】有向图网络

专知会员服务

82+阅读 · 2021年5月10日

【ICML2022】在线决策Transformer

【ICML2022】在线决策Transformer

专知

2+阅读 · 2022年7月27日

【ICML2022】因果Transformer:估算反事实结果的因果, 附ppt

【ICML2022】因果Transformer:估算反事实结果的因果, 附ppt

专知

2+阅读 · 2022年7月20日

【ICML2022】通过评估演示者的专业知识进行模仿学习

【ICML2022】通过评估演示者的专业知识进行模仿学习

专知

3+阅读 · 2022年7月18日

BERT为何无法彻底干掉BM25？？

BERT为何无法彻底干掉BM25？？

夕小瑶的卖萌屋

0+阅读 · 2022年6月28日

为什么深度学习是非参数的？

为什么深度学习是非参数的？

THU数据派

1+阅读 · 2022年3月29日

ACL2022 | 基于强化学习的实体对齐

ACL2022 | 基于强化学习的实体对齐

专知

1+阅读 · 2022年3月15日

【EMNLP2019】最新5篇论文推荐，BERT，对话系统，知识图谱，注意力机制等

【EMNLP2019】最新5篇论文推荐，BERT，对话系统，知识图谱，注意力机制等

专知

32+阅读 · 2019年8月17日

集多种半监督学习范式为一体，谷歌新研究提出新型半监督方法 MixMatch

集多种半监督学习范式为一体，谷歌新研究提出新型半监督方法 MixMatch

机器之心

11+阅读 · 2019年6月3日

NIPS 2018 | 作为多目标优化的多任务学习：寻找帕累托最优解

NIPS 2018 | 作为多目标优化的多任务学习：寻找帕累托最优解

极市平台

20+阅读 · 2018年10月29日

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

机器之心

15+阅读 · 2018年10月21日

基于多源异构不确定数据的高效用信息挖掘的研究

国家自然科学基金

4+阅读 · 2015年12月31日

随机广义纳什均衡问题的研究及应用

国家自然科学基金

0+阅读 · 2015年12月31日

不确定环境下具有稀疏特征的鲁棒投资组合选择问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

通信受限多个体网络的一致性和分布式优化研究

国家自然科学基金

8+阅读 · 2014年12月31日

网络演化博弈实验中的策略学习动力学与相变问题研究

国家自然科学基金

4+阅读 · 2014年12月31日

基于广义半参数回归模型的统计推断及其应用研究

国家自然科学基金

2+阅读 · 2013年12月31日

时滞拟不可积哈密顿系统随机动力学性态研究

国家自然科学基金

0+阅读 · 2012年12月31日

最优量子纠错码理论研究

国家自然科学基金

0+阅读 · 2009年12月31日

动态网络环境下服务快速合成与优化执行的算法研究

国家自然科学基金

0+阅读 · 2009年12月31日

供应不确定性对供应链最优决策的影响研究

国家自然科学基金

0+阅读 · 2009年12月31日

A General Formula for Uniform Common Randomness Capacity

Arxiv

0+阅读 · 2022年8月22日

Understanding Long Documents with Different Position-Aware Attentions

Arxiv

0+阅读 · 2022年8月17日

SelF-Eval: Self-supervised Fine-grained Dialogue Evaluation

Arxiv

1+阅读 · 2022年8月17日

In-vehicle alertness monitoring for older adults

Arxiv

0+阅读 · 2022年8月17日

Multimodal Lecture Presentations Dataset: Understanding Multimodality in Educational Slides

Arxiv

0+阅读 · 2022年8月17日

Masked Autoencoders Are Scalable Vision Learners

Arxiv

27+阅读 · 2021年11月11日

Equilibrium Refinements for Multi-Agent Influence Diagrams: Theory and Practice

Equilibrium Refinements for Multi-Agent Influence Diagrams: Theory and Practice

Arxiv

15+阅读 · 2021年2月9日

Graph Neural Networks with Heterophily

Arxiv

19+阅读 · 2021年2月4日

Fine-tune BERT for Extractive Summarization

Arxiv

21+阅读 · 2019年3月25日

Distance-based Self-Attention Network for Natural Language Inference

Arxiv

10+阅读 · 2017年12月6日

VIP会员

相关主题

相关VIP内容

【ICML2022】在线决策Transformer

【ICML2022】在线决策Transformer

专知会员服务

34+阅读 · 2022年7月27日

【ICML2022】因果Transformer:估算反事实结果的因果, 附ppt

【ICML2022】因果Transformer:估算反事实结果的因果, 附ppt

专知会员服务

83+阅读 · 2022年7月20日

【CMU博士论文】现代深度学习的均衡(Equilibrium)方法，155页pdf

【CMU博士论文】现代深度学习的均衡(Equilibrium)方法，155页pdf

专知会员服务

37+阅读 · 2022年6月16日

【ICML2022】鲁棒强化学习的策略梯度法

【ICML2022】鲁棒强化学习的策略梯度法

专知会员服务

38+阅读 · 2022年5月21日

【ICML2021】逆约束强化学习

专知会员服务

33+阅读 · 2021年9月7日

【ICML2021】密度约束强化学习

专知会员服务

22+阅读 · 2021年6月26日

【ICML2021】策略梯度贝叶斯鲁棒优化的模仿学习

专知会员服务

25+阅读 · 2021年6月15日

【ICML2021】数据表示的几何评估

专知会员服务

38+阅读 · 2021年6月3日

【ICML2021】数据高效深度学习的自调优

专知会员服务

22+阅读 · 2021年5月14日

【ICML2021】有向图网络

专知会员服务

82+阅读 · 2021年5月10日

热门VIP内容

开通专知VIP会员享更多权益服务

操作系统智能体：基于多模态大模型（MLLM）的通用计算设备智能体综述

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

自主人工智能：未来战争是否将是自主化的？

相关资讯

【ICML2022】在线决策Transformer

【ICML2022】在线决策Transformer

专知

2+阅读 · 2022年7月27日

【ICML2022】因果Transformer:估算反事实结果的因果, 附ppt

【ICML2022】因果Transformer:估算反事实结果的因果, 附ppt

专知

2+阅读 · 2022年7月20日

【ICML2022】通过评估演示者的专业知识进行模仿学习

【ICML2022】通过评估演示者的专业知识进行模仿学习

专知

3+阅读 · 2022年7月18日

BERT为何无法彻底干掉BM25？？

BERT为何无法彻底干掉BM25？？

夕小瑶的卖萌屋

0+阅读 · 2022年6月28日

为什么深度学习是非参数的？

为什么深度学习是非参数的？

THU数据派

1+阅读 · 2022年3月29日

ACL2022 | 基于强化学习的实体对齐

ACL2022 | 基于强化学习的实体对齐

专知

1+阅读 · 2022年3月15日

【EMNLP2019】最新5篇论文推荐，BERT，对话系统，知识图谱，注意力机制等

【EMNLP2019】最新5篇论文推荐，BERT，对话系统，知识图谱，注意力机制等

专知

32+阅读 · 2019年8月17日

集多种半监督学习范式为一体，谷歌新研究提出新型半监督方法 MixMatch

集多种半监督学习范式为一体，谷歌新研究提出新型半监督方法 MixMatch

机器之心

11+阅读 · 2019年6月3日

NIPS 2018 | 作为多目标优化的多任务学习：寻找帕累托最优解

NIPS 2018 | 作为多目标优化的多任务学习：寻找帕累托最优解

极市平台

20+阅读 · 2018年10月29日

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

机器之心

15+阅读 · 2018年10月21日

相关基金

基于多源异构不确定数据的高效用信息挖掘的研究

国家自然科学基金

4+阅读 · 2015年12月31日

随机广义纳什均衡问题的研究及应用

国家自然科学基金

0+阅读 · 2015年12月31日

不确定环境下具有稀疏特征的鲁棒投资组合选择问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

通信受限多个体网络的一致性和分布式优化研究

国家自然科学基金

8+阅读 · 2014年12月31日

网络演化博弈实验中的策略学习动力学与相变问题研究

国家自然科学基金

4+阅读 · 2014年12月31日

基于广义半参数回归模型的统计推断及其应用研究

国家自然科学基金

2+阅读 · 2013年12月31日

时滞拟不可积哈密顿系统随机动力学性态研究

国家自然科学基金

0+阅读 · 2012年12月31日

最优量子纠错码理论研究

国家自然科学基金

0+阅读 · 2009年12月31日

动态网络环境下服务快速合成与优化执行的算法研究

国家自然科学基金

0+阅读 · 2009年12月31日

供应不确定性对供应链最优决策的影响研究

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

A General Formula for Uniform Common Randomness Capacity

Arxiv

0+阅读 · 2022年8月22日

Understanding Long Documents with Different Position-Aware Attentions

Arxiv

0+阅读 · 2022年8月17日

SelF-Eval: Self-supervised Fine-grained Dialogue Evaluation

Arxiv

1+阅读 · 2022年8月17日

In-vehicle alertness monitoring for older adults

Arxiv

0+阅读 · 2022年8月17日

Multimodal Lecture Presentations Dataset: Understanding Multimodality in Educational Slides

Arxiv

0+阅读 · 2022年8月17日

Masked Autoencoders Are Scalable Vision Learners

Arxiv

27+阅读 · 2021年11月11日

Equilibrium Refinements for Multi-Agent Influence Diagrams: Theory and Practice

Equilibrium Refinements for Multi-Agent Influence Diagrams: Theory and Practice

Arxiv

15+阅读 · 2021年2月9日

Graph Neural Networks with Heterophily

Arxiv

19+阅读 · 2021年2月4日

Fine-tune BERT for Extractive Summarization

Arxiv

21+阅读 · 2019年3月25日

Distance-based Self-Attention Network for Natural Language Inference

Arxiv

10+阅读 · 2017年12月6日

微信扫码咨询专知VIP会员