【ICML2024】上下文感知标记化的高效世界模型 - 专知VIP

会员服务 ·

7

ICML 2024 · 世界模型 · 深度强化学习 ·

【ICML2024】上下文感知标记化的高效世界模型

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

深度强化学习（RL）方法的扩展提出了一个显著的挑战。随着生成模型的发展，基于模型的RL成为一个有力的竞争者。最近在序列建模方面的进展带来了有效的基于Transformer的世界模型，尽管这些模型由于需要长序列的标记来准确模拟环境而导致计算量巨大。在这项工作中，我们提出了∆-IRIS，这是一种具有世界模型架构的新型智能体，该架构由一个离散自动编码器组成，该编码器对时间步之间的随机变化进行编码，以及一个自回归Transformer，该Transformer通过用连续标记总结当前世界状态来预测未来的变化。在Crafter基准测试中，∆-IRIS在多个帧预算中设立了新的状态标准，同时其训练速度比之前的基于注意力的方法快一个数量级。我们在https://github.com/vmicheli/delta-iris上发布了我们的代码和模型。

成为VIP会员查看完整内容

13

相关内容

ICML 2024

【WWW2024】博弈论式反事实解释图神经网络

【WWW2024】博弈论式反事实解释图神经网络

专知会员服务

28+阅读 · 2月17日

【NeurIPS2023】大型预训练模型的等变自适应

【NeurIPS2023】大型预训练模型的等变自适应

专知会员服务

30+阅读 · 2023年10月4日

【KDD2022】自监督超图Transformer推荐系统

【KDD2022】自监督超图Transformer推荐系统

专知会员服务

33+阅读 · 2022年8月1日

【CVPR2022】多视图聚合的大规模三维语义分割

【CVPR2022】多视图聚合的大规模三维语义分割

专知会员服务

20+阅读 · 2022年4月20日

【ICML2021】面向个性化学习的模型融合

专知会员服务

21+阅读 · 2021年9月27日

【ICML2021】具有超参数重要性的可解释的自动图表示学习

专知会员服务

24+阅读 · 2021年7月18日

【SIGIR2021】基于嵌入的增量式时序知识图谱补全框架

【SIGIR2021】基于嵌入的增量式时序知识图谱补全框架

专知会员服务

60+阅读 · 2021年4月21日

【WWW2021】归一化硬样本挖掘的双重注意匹配网络

【WWW2021】归一化硬样本挖掘的双重注意匹配网络

专知会员服务

17+阅读 · 2021年3月31日

【AAAI2020】基于属性指导和纯视觉的注意力对齐的小样本识别

【AAAI2020】基于属性指导和纯视觉的注意力对齐的小样本识别

专知会员服务

13+阅读 · 2021年1月14日

【WSDM 2021】面向信息检索的预训练语言模型

专知会员服务

34+阅读 · 2020年11月29日

时空数据挖掘:综述

时空数据挖掘:综述

专知

22+阅读 · 2022年6月30日

【CVPR2021】CausalVAE: 引入因果结构的解耦表示学习

【CVPR2021】CausalVAE: 引入因果结构的解耦表示学习

专知

18+阅读 · 2021年3月28日

【深度度量学习系列】Triplet-loss原理与应用

【深度度量学习系列】Triplet-loss原理与应用

AINLP

57+阅读 · 2020年10月7日

【NeurIPS2020-MIT】子图神经网络，Subgraph Neural Networks

【NeurIPS2020-MIT】子图神经网络，Subgraph Neural Networks

专知

38+阅读 · 2020年9月30日

最新《图嵌入组合优化》综述论文，40页pdf

最新《图嵌入组合优化》综述论文，40页pdf

专知

38+阅读 · 2020年8月31日

【KDD2020-Tutorial】深度学习异常检测，180页ppt

【KDD2020-Tutorial】深度学习异常检测，180页ppt

专知

40+阅读 · 2020年8月28日

【KDD2020】图神经网络生成式预训练

【KDD2020】图神经网络生成式预训练

专知

22+阅读 · 2020年7月3日

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

专知

17+阅读 · 2020年6月7日

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

专知

12+阅读 · 2020年4月1日

一文详解深度学习在命名实体识别(NER)中的应用

一文详解深度学习在命名实体识别(NER)中的应用

AINLP

23+阅读 · 2018年10月23日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

1+阅读 · 2015年12月31日

SDN数据平面中大规模流表的高性能查找方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于支撑函数的不规则形态扩展目标建模和估计研究

国家自然科学基金

0+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

6+阅读 · 2015年12月31日

纵向数据的动态半参数建模及其统计推断

国家自然科学基金

0+阅读 · 2014年12月31日

高维数据下的模型平均方法

国家自然科学基金

4+阅读 · 2014年12月31日

基于结构学习的非平行支持向量机最优化方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

非线性混合效应模型的最优与稳健设计

国家自然科学基金

0+阅读 · 2014年12月31日

复杂数据下含指标项半参数模型结构的统计推断及应用

国家自然科学基金

0+阅读 · 2014年12月31日

高维复杂结构数据降维

国家自然科学基金

8+阅读 · 2014年12月31日

On the consistency of hyper-parameter selection in value-based deep reinforcement learning

Arxiv

0+阅读 · 7月2日

Multifidelity linear regression for scientific machine learning from scarce data

Arxiv

0+阅读 · 7月1日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

144+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

32+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

79+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

152+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

353+阅读 · 2023年3月31日

Nature Language Reasoning, A Survey

Arxiv

59+阅读 · 2023年3月26日

Data-centric Artificial Intelligence: A Survey

Arxiv

18+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

22+阅读 · 2023年1月13日

VIP会员

相关主题

深度强化学习

相关VIP内容

【WWW2024】博弈论式反事实解释图神经网络

【WWW2024】博弈论式反事实解释图神经网络

专知会员服务

28+阅读 · 2月17日

【NeurIPS2023】大型预训练模型的等变自适应

【NeurIPS2023】大型预训练模型的等变自适应

专知会员服务

30+阅读 · 2023年10月4日

【KDD2022】自监督超图Transformer推荐系统

【KDD2022】自监督超图Transformer推荐系统

专知会员服务

33+阅读 · 2022年8月1日

【CVPR2022】多视图聚合的大规模三维语义分割

【CVPR2022】多视图聚合的大规模三维语义分割

专知会员服务

20+阅读 · 2022年4月20日

【ICML2021】面向个性化学习的模型融合

专知会员服务

21+阅读 · 2021年9月27日

【ICML2021】具有超参数重要性的可解释的自动图表示学习

专知会员服务

24+阅读 · 2021年7月18日

【SIGIR2021】基于嵌入的增量式时序知识图谱补全框架

【SIGIR2021】基于嵌入的增量式时序知识图谱补全框架

专知会员服务

60+阅读 · 2021年4月21日

【WWW2021】归一化硬样本挖掘的双重注意匹配网络

【WWW2021】归一化硬样本挖掘的双重注意匹配网络

专知会员服务

17+阅读 · 2021年3月31日

【AAAI2020】基于属性指导和纯视觉的注意力对齐的小样本识别

【AAAI2020】基于属性指导和纯视觉的注意力对齐的小样本识别

专知会员服务

13+阅读 · 2021年1月14日

【WSDM 2021】面向信息检索的预训练语言模型

专知会员服务

34+阅读 · 2020年11月29日

热门VIP内容

相关资讯

时空数据挖掘:综述

时空数据挖掘:综述

专知

22+阅读 · 2022年6月30日

【CVPR2021】CausalVAE: 引入因果结构的解耦表示学习

【CVPR2021】CausalVAE: 引入因果结构的解耦表示学习

专知

18+阅读 · 2021年3月28日

【深度度量学习系列】Triplet-loss原理与应用

【深度度量学习系列】Triplet-loss原理与应用

AINLP

57+阅读 · 2020年10月7日

【NeurIPS2020-MIT】子图神经网络，Subgraph Neural Networks

【NeurIPS2020-MIT】子图神经网络，Subgraph Neural Networks

专知

38+阅读 · 2020年9月30日

最新《图嵌入组合优化》综述论文，40页pdf

最新《图嵌入组合优化》综述论文，40页pdf

专知

38+阅读 · 2020年8月31日

【KDD2020-Tutorial】深度学习异常检测，180页ppt

【KDD2020-Tutorial】深度学习异常检测，180页ppt

专知

40+阅读 · 2020年8月28日

【KDD2020】图神经网络生成式预训练

【KDD2020】图神经网络生成式预训练

专知

22+阅读 · 2020年7月3日

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

专知

17+阅读 · 2020年6月7日

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

专知

12+阅读 · 2020年4月1日

一文详解深度学习在命名实体识别(NER)中的应用

一文详解深度学习在命名实体识别(NER)中的应用

AINLP

23+阅读 · 2018年10月23日

相关基金

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

1+阅读 · 2015年12月31日

SDN数据平面中大规模流表的高性能查找方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于支撑函数的不规则形态扩展目标建模和估计研究

国家自然科学基金

0+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

6+阅读 · 2015年12月31日

纵向数据的动态半参数建模及其统计推断

国家自然科学基金

0+阅读 · 2014年12月31日

高维数据下的模型平均方法

国家自然科学基金

4+阅读 · 2014年12月31日

基于结构学习的非平行支持向量机最优化方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

非线性混合效应模型的最优与稳健设计

国家自然科学基金

0+阅读 · 2014年12月31日

复杂数据下含指标项半参数模型结构的统计推断及应用

国家自然科学基金

0+阅读 · 2014年12月31日

高维复杂结构数据降维

国家自然科学基金

8+阅读 · 2014年12月31日

相关论文

On the consistency of hyper-parameter selection in value-based deep reinforcement learning

Arxiv

0+阅读 · 7月2日

Multifidelity linear regression for scientific machine learning from scarce data

Arxiv

0+阅读 · 7月1日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

144+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

32+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

79+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

152+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

353+阅读 · 2023年3月31日

Nature Language Reasoning, A Survey

Arxiv

59+阅读 · 2023年3月26日

Data-centric Artificial Intelligence: A Survey

Arxiv

18+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

22+阅读 · 2023年1月13日

微信扫码咨询专知VIP会员