【NeurIPS2021】对比主动推理 - 专知VIP

会员服务 ·

7

主动推理 · 对比学习 · NeurIPS 2021 · 论文 ·

2021 年 10 月 21 日

【NeurIPS2021】对比主动推理

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

主动推理是一种关于感知和行动的统一理论，其基础是大脑通过最小化自由能来维持世界的内部模型。从行为角度来看，主动推理代理可以被视为自我证明的存在，通过行动来实现他们的乐观预测，即首选结果或目标。相反，强化学习需要人为设计的奖励来实现任何期望的结果。尽管主动推理可以为控制提供一个更自然的自监督目标，但它的适用性受到限制，因为该方法在复杂环境下可扩展性不足。在这项工作中，我们提出了一个主动推理的对比目标，这大大减少了学习agent生成模型和规划未来行动的计算负担。在基于图像的任务中，我们的方法比基于可能性的主动推理表现得明显更好，同时计算成本更低，更容易训练。我们将其与强化学习代理进行了比较，这些代理可以获得人类设计的奖励功能，表明我们的方法与它们的表现非常匹配。最后，我们还表明对比方法在环境干扰的情况下有显著的更好的表现。

https://arxiv.org/abs/2110.10083

成为VIP会员查看完整内容

30

相关内容

主动推理

【NeurIPS2021】学习用于分布外预测的因果语义表示

【NeurIPS2021】学习用于分布外预测的因果语义表示

专知会员服务

18+阅读 · 2021年11月19日

【NeurIPS2021】去栅格化的矢量图识别

【NeurIPS2021】去栅格化的矢量图识别

专知会员服务

16+阅读 · 2021年11月18日

【NeurIPS2021】用于视频分割的密集无监督学习

【NeurIPS2021】用于视频分割的密集无监督学习

专知会员服务

15+阅读 · 2021年11月14日

【NeurIPS2021】利用预训练对比表示征的逆问题

专知会员服务

10+阅读 · 2021年10月17日

【NeurIPS2021】基于自适应均衡学习的半监督语义分割

专知会员服务

14+阅读 · 2021年10月13日

【NeurIPS2021】黑箱学习算法的信息理论泛化界

专知会员服务

23+阅读 · 2021年10月6日

【NeurIPS2020 】数据扩充的图对比学习

【NeurIPS2020 】数据扩充的图对比学习

专知会员服务

49+阅读 · 2020年11月9日

最新《对比监督学习》综述论文，20页pdf

最新《对比监督学习》综述论文，20页pdf

专知会员服务

85+阅读 · 2020年11月5日

【NeurIPS2020】无限可能的联合对比学习

专知会员服务

29+阅读 · 2020年10月2日

【NeurIPS2020】图网的主邻域聚合

【NeurIPS2020】图网的主邻域聚合

专知会员服务

33+阅读 · 2020年9月27日

【NeurIPS2020 】数据扩充的图对比学习

【NeurIPS2020 】数据扩充的图对比学习

专知

9+阅读 · 2020年11月9日

【NeurIPS2020】无限可能的联合对比学习

【NeurIPS2020】无限可能的联合对比学习

专知

3+阅读 · 2020年10月2日

对比自监督学习

对比自监督学习

深度学习自然语言处理

34+阅读 · 2020年7月15日

每类13张标注图就可从头学分类器，DeepMind新半监督模型超越AlexNet

每类13张标注图就可从头学分类器，DeepMind新半监督模型超越AlexNet

机器之心

9+阅读 · 2019年5月31日

在稀疏和欠明确奖励中学习泛化

在稀疏和欠明确奖励中学习泛化

谷歌开发者

6+阅读 · 2019年3月20日

基于自编码器的表征学习：如何攻克半监督和无监督学习？

基于自编码器的表征学习：如何攻克半监督和无监督学习？

机器之心

12+阅读 · 2018年12月22日

学界 | 最大化互信息来学习深度表示，Bengio等提出Deep INFOMAX

学界 | 最大化互信息来学习深度表示，Bengio等提出Deep INFOMAX

机器之心

10+阅读 · 2018年9月6日

学界 | DeepMind提出对比预测编码，通过预测未来学习高级表征

学界 | DeepMind提出对比预测编码，通过预测未来学习高级表征

机器之心

6+阅读 · 2018年7月28日

无监督学习最新研究：图像旋转为特征学习提供强大的替代监督信号

无监督学习最新研究：图像旋转为特征学习提供强大的替代监督信号

德先生

10+阅读 · 2018年3月29日

学界 | 面向无监督任务：DeepMind提出神经离散表示学习生成模型VQ-VAE

学界 | 面向无监督任务：DeepMind提出神经离散表示学习生成模型VQ-VAE

机器之心

6+阅读 · 2017年11月10日

Infusing Finetuning with Semantic Dependencies

Arxiv

0+阅读 · 2021年12月16日

SPTS: Single-Point Text Spotting

Arxiv

0+阅读 · 2021年12月15日

Geometry-Contrastive Transformer for Generalized 3D Pose Transfer

Arxiv

0+阅读 · 2021年12月14日

Pix2seq: A Language Modeling Framework for Object Detection

Arxiv

10+阅读 · 2021年9月22日

Towards Full-line Code Completion with Neural Language Models

Towards Full-line Code Completion with Neural Language Models

Arxiv

3+阅读 · 2020年9月18日

Look-into-Object: Self-supervised Structure Modeling for Object Recognition

Look-into-Object: Self-supervised Structure Modeling for Object Recognition

Arxiv

15+阅读 · 2020年3月31日

Frustratingly Simple Few-Shot Object Detection

Frustratingly Simple Few-Shot Object Detection

Arxiv

3+阅读 · 2020年3月16日

Language as an Abstraction for Hierarchical Deep Reinforcement Learning

Language as an Abstraction for Hierarchical Deep Reinforcement Learning

Arxiv

5+阅读 · 2019年6月18日

FoveaBox: Beyond Anchor-based Object Detector

Arxiv

5+阅读 · 2019年4月8日

A Generative Model For Zero Shot Learning Using Conditional Variational Autoencoders

Arxiv

9+阅读 · 2018年1月27日

VIP会员

相关主题

相关VIP内容

【NeurIPS2021】学习用于分布外预测的因果语义表示

【NeurIPS2021】学习用于分布外预测的因果语义表示

专知会员服务

18+阅读 · 2021年11月19日

【NeurIPS2021】去栅格化的矢量图识别

【NeurIPS2021】去栅格化的矢量图识别

专知会员服务

16+阅读 · 2021年11月18日

【NeurIPS2021】用于视频分割的密集无监督学习

【NeurIPS2021】用于视频分割的密集无监督学习

专知会员服务

15+阅读 · 2021年11月14日

【NeurIPS2021】利用预训练对比表示征的逆问题

专知会员服务

10+阅读 · 2021年10月17日

【NeurIPS2021】基于自适应均衡学习的半监督语义分割

专知会员服务

14+阅读 · 2021年10月13日

【NeurIPS2021】黑箱学习算法的信息理论泛化界

专知会员服务

23+阅读 · 2021年10月6日

【NeurIPS2020 】数据扩充的图对比学习

【NeurIPS2020 】数据扩充的图对比学习

专知会员服务

49+阅读 · 2020年11月9日

最新《对比监督学习》综述论文，20页pdf

最新《对比监督学习》综述论文，20页pdf

专知会员服务

85+阅读 · 2020年11月5日

【NeurIPS2020】无限可能的联合对比学习

专知会员服务

29+阅读 · 2020年10月2日

【NeurIPS2020】图网的主邻域聚合

【NeurIPS2020】图网的主邻域聚合

专知会员服务

33+阅读 · 2020年9月27日

热门VIP内容

开通专知VIP会员享更多权益服务

【牛津博士论文】零样本强化学习综述

《美军条令：陆军指挥官与规划人员地理空间指南》60页

战术边缘指挥控制：防务面临的核心挑战

迈向开放世界检测：综述

相关资讯

【NeurIPS2020 】数据扩充的图对比学习

【NeurIPS2020 】数据扩充的图对比学习

专知

9+阅读 · 2020年11月9日

【NeurIPS2020】无限可能的联合对比学习

【NeurIPS2020】无限可能的联合对比学习

专知

3+阅读 · 2020年10月2日

对比自监督学习

对比自监督学习

深度学习自然语言处理

34+阅读 · 2020年7月15日

每类13张标注图就可从头学分类器，DeepMind新半监督模型超越AlexNet

每类13张标注图就可从头学分类器，DeepMind新半监督模型超越AlexNet

机器之心

9+阅读 · 2019年5月31日

在稀疏和欠明确奖励中学习泛化

在稀疏和欠明确奖励中学习泛化

谷歌开发者

6+阅读 · 2019年3月20日

基于自编码器的表征学习：如何攻克半监督和无监督学习？

基于自编码器的表征学习：如何攻克半监督和无监督学习？

机器之心

12+阅读 · 2018年12月22日

学界 | 最大化互信息来学习深度表示，Bengio等提出Deep INFOMAX

学界 | 最大化互信息来学习深度表示，Bengio等提出Deep INFOMAX

机器之心

10+阅读 · 2018年9月6日

学界 | DeepMind提出对比预测编码，通过预测未来学习高级表征

学界 | DeepMind提出对比预测编码，通过预测未来学习高级表征

机器之心

6+阅读 · 2018年7月28日

无监督学习最新研究：图像旋转为特征学习提供强大的替代监督信号

无监督学习最新研究：图像旋转为特征学习提供强大的替代监督信号

德先生

10+阅读 · 2018年3月29日

学界 | 面向无监督任务：DeepMind提出神经离散表示学习生成模型VQ-VAE

学界 | 面向无监督任务：DeepMind提出神经离散表示学习生成模型VQ-VAE

机器之心

6+阅读 · 2017年11月10日

相关论文

Infusing Finetuning with Semantic Dependencies

Arxiv

0+阅读 · 2021年12月16日

SPTS: Single-Point Text Spotting

Arxiv

0+阅读 · 2021年12月15日

Geometry-Contrastive Transformer for Generalized 3D Pose Transfer

Arxiv

0+阅读 · 2021年12月14日

Pix2seq: A Language Modeling Framework for Object Detection

Arxiv

10+阅读 · 2021年9月22日

Towards Full-line Code Completion with Neural Language Models

Towards Full-line Code Completion with Neural Language Models

Arxiv

3+阅读 · 2020年9月18日

Look-into-Object: Self-supervised Structure Modeling for Object Recognition

Look-into-Object: Self-supervised Structure Modeling for Object Recognition

Arxiv

15+阅读 · 2020年3月31日

Frustratingly Simple Few-Shot Object Detection

Frustratingly Simple Few-Shot Object Detection

Arxiv

3+阅读 · 2020年3月16日

Language as an Abstraction for Hierarchical Deep Reinforcement Learning

Language as an Abstraction for Hierarchical Deep Reinforcement Learning

Arxiv

5+阅读 · 2019年6月18日

FoveaBox: Beyond Anchor-based Object Detector

Arxiv

5+阅读 · 2019年4月8日

A Generative Model For Zero Shot Learning Using Conditional Variational Autoencoders

Arxiv

9+阅读 · 2018年1月27日

微信扫码咨询专知VIP会员