【剑桥大学博士论文】面向计算机视觉的神经世界模型，211页pdf - 专知VIP

会员服务 ·

36

剑桥大学 · 博士论文 · 计算机视觉 · 神经世界模型 ·

2023 年 2 月 5 日

【剑桥大学博士论文】面向计算机视觉的神经世界模型，211页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

**人类通过被动观察和主动互动来学习世界的心理模型，从而在环境中导航。他们的世界模型允许他们预测接下来可能发生的事情，并根据潜在的目标采取相应的行动。**这样的世界模型在自动驾驶等复杂环境的规划方面具有强大的前景。人类司机或自动驾驶系统用眼睛或相机感知周围环境。他们推断出世界的一种内部表示应该:(i)具有空间记忆(例如遮挡)，(ii)填充部分可观测或有噪声的输入(例如被阳光蒙蔽时)，以及(iii)能够概率地推理不可观测的事件(例如预测不同的可能的未来)。它们是具身的智能体，可以通过其世界模型在物理世界中预测、计划和行动。本文提出一个通用框架，从摄像机观察和专家演示中训练世界模型和策略，由深度神经网络参数化。利用几何、语义和运动等重要的计算机视觉概念，将世界模型扩展到复杂的城市驾驶场景。**在我们的框架中，我们推导了这种主动推理设置的概率模型，其目标是推断解释主动代理的观察和行动的潜在动力学。**我们通过确保模型预测准确的重建以及合理的操作和过渡来优化日志证据的下界。首先，我们提出了一个模型，预测计算机视觉中的重要量:深度、语义分割和光流。然后，我们使用三维几何作为归纳偏差在鸟瞰空间中操作。我们首次提出了一个模型，可以从360◦环绕单目摄像机鸟瞰动态代理的概率未来轨迹。最后，我们展示了在闭环驾驶中学习世界模型的好处。我们的模型可以联合预测城市驾驶环境中的静态场景、动态场景和自我行为。我们表明，学习世界模型和驾驶策略可以生成超过1小时的预测(比训练序列大小长2000倍)。

成为VIP会员查看完整内容

63

相关内容

剑桥大学

剑桥大学（英语：University of Cambridge；勋衔：Cantab）为一所座落于英国剑桥郡剑桥市的研究型大学。它是英语世界中历史第二悠久的大学，也是世界现存第四古老的大学。剑桥大学的起源为一群牛津大学的学者，因与牛津市民发生冲突而移居至剑桥。剑桥与牛津这两所在中世纪建立的英国大学，在校务运作、学术声望、社会地位等多方面都非常相似，经常合称为“牛剑”

【剑桥大学博士论文】主动学习与序列决策研究进展，160页pdf

【剑桥大学博士论文】主动学习与序列决策研究进展，160页pdf

专知会员服务

78+阅读 · 2023年2月13日

【剑桥大学博士论文】机器学习安全性，148页pdf

【剑桥大学博士论文】机器学习安全性，148页pdf

专知会员服务

42+阅读 · 2023年2月13日

【普林斯顿博士论文】动力系统的安全强化学习与约束学习，245页pdf

【普林斯顿博士论文】动力系统的安全强化学习与约束学习，245页pdf

专知会员服务

40+阅读 · 2023年2月2日

【伯克利博士论文】可信赖机器学习，227页pdf

【伯克利博士论文】可信赖机器学习，227页pdf

专知会员服务

89+阅读 · 2022年12月12日

【CMU博士论文】非结构化环境中的多模态导航学习，177页pdf

【CMU博士论文】非结构化环境中的多模态导航学习，177页pdf

专知会员服务

49+阅读 · 2022年12月8日

【牛津大学博士论文】视觉目标结构表示的自监督学习，127页pdf

【牛津大学博士论文】视觉目标结构表示的自监督学习，127页pdf

专知会员服务

45+阅读 · 2022年9月29日

【斯坦福博士论文】不确定性时空感知的自动驾驶汽车，136页pdf

【斯坦福博士论文】不确定性时空感知的自动驾驶汽车，136页pdf

专知会员服务

65+阅读 · 2022年9月25日

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

专知会员服务

104+阅读 · 2022年9月21日

【博士论文】多任务学习视觉场景理解，140页pdf

【博士论文】多任务学习视觉场景理解，140页pdf

专知会员服务

91+阅读 · 2022年4月5日

【CMU博士论文】机器人深度强化学习，128页pdf

【CMU博士论文】机器人深度强化学习，128页pdf

专知会员服务

133+阅读 · 2020年8月27日

【博士论文】鲁棒深度学习自动驾驶，160页pdf

【博士论文】鲁棒深度学习自动驾驶，160页pdf

专知

6+阅读 · 2022年11月17日

【剑桥大学博士论文】计算机系统中的端到端深度强化学习，188页pdf

【剑桥大学博士论文】计算机系统中的端到端深度强化学习，188页pdf

专知

6+阅读 · 2022年10月31日

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

专知

9+阅读 · 2022年10月29日

【牛津大学博士论文】视觉目标结构表示的自监督学习，127页pdf

【牛津大学博士论文】视觉目标结构表示的自监督学习，127页pdf

专知

1+阅读 · 2022年9月29日

【斯坦福博士论文】不确定性时空感知的自动驾驶汽车，136页pdf

【斯坦福博士论文】不确定性时空感知的自动驾驶汽车，136页pdf

专知

9+阅读 · 2022年9月25日

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

专知

8+阅读 · 2022年9月21日

【斯坦福博士论文】基于压缩模型高效验证的可信机器学习，90页pdf

【斯坦福博士论文】基于压缩模型高效验证的可信机器学习，90页pdf

专知

2+阅读 · 2022年9月16日

【MIT博士论文】分层概率多模态数据融合研究进展，289页pdf

【MIT博士论文】分层概率多模态数据融合研究进展，289页pdf

专知

2+阅读 · 2022年9月6日

【CMU博士论文】多视图上下文理解的知识增强表示学习，179页pdf

【CMU博士论文】多视图上下文理解的知识增强表示学习，179页pdf

专知

5+阅读 · 2022年8月11日

【博士论文】多任务学习视觉场景理解，140页pdf

【博士论文】多任务学习视觉场景理解，140页pdf

专知

28+阅读 · 2022年4月5日

基于生物视觉启发特征和遮挡模型的复杂道路环境目标检测方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向事件检测的感知数据处理方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向智能视觉监控的大规模慢特征学习研究

国家自然科学基金

3+阅读 · 2014年12月31日

线驱软体机器人视觉伺服的研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于微分几何和机器学习的立体视觉研究

国家自然科学基金

2+阅读 · 2013年12月31日

跟踪器融合的视觉跟踪方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

面向大数据的机器学习理论与方法

国家自然科学基金

4+阅读 · 2013年12月31日

基于立体视觉深度学习的车辆前方可通行性分析研究

国家自然科学基金

2+阅读 · 2012年12月31日

机器学习中模型选择问题的研究及其在图像理解中的应用

国家自然科学基金

8+阅读 · 2008年12月31日

基于协同学的并行多层次反馈图像理解研究

国家自然科学基金

1+阅读 · 2008年12月31日

Class-Incremental Exemplar Compression for Class-Incremental Learning

Arxiv

0+阅读 · 2023年3月24日

Finite Volume Approximations for Non-Linear Parabolic Problems with Stochastic Forcing

Arxiv

0+阅读 · 2023年3月23日

Fréchet single index models for object response regression

Arxiv

0+阅读 · 2023年3月22日

Matryoshka Policy Gradient for Entropy-Regularized RL: Convergence and Global Optimality

Arxiv

0+阅读 · 2023年3月22日

Dynamic Relevance Learning for Few-Shot Object Detection

Arxiv

0+阅读 · 2023年3月22日

EasyDGL: Encode, Train and Interpret for Continuous-time Dynamic Graph Learning

Arxiv

0+阅读 · 2023年3月22日

Self-supervised Meta-Prompt Learning with Meta-Gradient Regularization for Few-shot Generalization

Arxiv

0+阅读 · 2023年3月22日

Prompt Distribution Learning

Arxiv

14+阅读 · 2022年5月6日

Few-Shot Graph Classification with Model Agnostic Meta-Learning

Arxiv

23+阅读 · 2020年3月18日

Latent Relation Language Models

Arxiv

21+阅读 · 2019年8月21日

VIP会员

相关主题

计算机视觉

神经世界模型

相关VIP内容

【剑桥大学博士论文】主动学习与序列决策研究进展，160页pdf

【剑桥大学博士论文】主动学习与序列决策研究进展，160页pdf

专知会员服务

78+阅读 · 2023年2月13日

【剑桥大学博士论文】机器学习安全性，148页pdf

【剑桥大学博士论文】机器学习安全性，148页pdf

专知会员服务

42+阅读 · 2023年2月13日

【普林斯顿博士论文】动力系统的安全强化学习与约束学习，245页pdf

【普林斯顿博士论文】动力系统的安全强化学习与约束学习，245页pdf

专知会员服务

40+阅读 · 2023年2月2日

【伯克利博士论文】可信赖机器学习，227页pdf

【伯克利博士论文】可信赖机器学习，227页pdf

专知会员服务

89+阅读 · 2022年12月12日

【CMU博士论文】非结构化环境中的多模态导航学习，177页pdf

【CMU博士论文】非结构化环境中的多模态导航学习，177页pdf

专知会员服务

49+阅读 · 2022年12月8日

【牛津大学博士论文】视觉目标结构表示的自监督学习，127页pdf

【牛津大学博士论文】视觉目标结构表示的自监督学习，127页pdf

专知会员服务

45+阅读 · 2022年9月29日

【斯坦福博士论文】不确定性时空感知的自动驾驶汽车，136页pdf

【斯坦福博士论文】不确定性时空感知的自动驾驶汽车，136页pdf

专知会员服务

65+阅读 · 2022年9月25日

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

专知会员服务

104+阅读 · 2022年9月21日

【博士论文】多任务学习视觉场景理解，140页pdf

【博士论文】多任务学习视觉场景理解，140页pdf

专知会员服务

91+阅读 · 2022年4月5日

【CMU博士论文】机器人深度强化学习，128页pdf

【CMU博士论文】机器人深度强化学习，128页pdf

专知会员服务

133+阅读 · 2020年8月27日

热门VIP内容

开通专知VIP会员享更多权益服务

【牛津博士论文】零样本强化学习综述

《美军条令：陆军指挥官与规划人员地理空间指南》60页

战术边缘指挥控制：防务面临的核心挑战

迈向开放世界检测：综述

相关资讯

【博士论文】鲁棒深度学习自动驾驶，160页pdf

【博士论文】鲁棒深度学习自动驾驶，160页pdf

专知

6+阅读 · 2022年11月17日

【剑桥大学博士论文】计算机系统中的端到端深度强化学习，188页pdf

【剑桥大学博士论文】计算机系统中的端到端深度强化学习，188页pdf

专知

6+阅读 · 2022年10月31日

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

专知

9+阅读 · 2022年10月29日

【牛津大学博士论文】视觉目标结构表示的自监督学习，127页pdf

【牛津大学博士论文】视觉目标结构表示的自监督学习，127页pdf

专知

1+阅读 · 2022年9月29日

【斯坦福博士论文】不确定性时空感知的自动驾驶汽车，136页pdf

【斯坦福博士论文】不确定性时空感知的自动驾驶汽车，136页pdf

专知

9+阅读 · 2022年9月25日

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

专知

8+阅读 · 2022年9月21日

【斯坦福博士论文】基于压缩模型高效验证的可信机器学习，90页pdf

【斯坦福博士论文】基于压缩模型高效验证的可信机器学习，90页pdf

专知

2+阅读 · 2022年9月16日

【MIT博士论文】分层概率多模态数据融合研究进展，289页pdf

【MIT博士论文】分层概率多模态数据融合研究进展，289页pdf

专知

2+阅读 · 2022年9月6日

【CMU博士论文】多视图上下文理解的知识增强表示学习，179页pdf

【CMU博士论文】多视图上下文理解的知识增强表示学习，179页pdf

专知

5+阅读 · 2022年8月11日

【博士论文】多任务学习视觉场景理解，140页pdf

【博士论文】多任务学习视觉场景理解，140页pdf

专知

28+阅读 · 2022年4月5日

相关基金

基于生物视觉启发特征和遮挡模型的复杂道路环境目标检测方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向事件检测的感知数据处理方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向智能视觉监控的大规模慢特征学习研究

国家自然科学基金

3+阅读 · 2014年12月31日

线驱软体机器人视觉伺服的研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于微分几何和机器学习的立体视觉研究

国家自然科学基金

2+阅读 · 2013年12月31日

跟踪器融合的视觉跟踪方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

面向大数据的机器学习理论与方法

国家自然科学基金

4+阅读 · 2013年12月31日

基于立体视觉深度学习的车辆前方可通行性分析研究

国家自然科学基金

2+阅读 · 2012年12月31日

机器学习中模型选择问题的研究及其在图像理解中的应用

国家自然科学基金

8+阅读 · 2008年12月31日

基于协同学的并行多层次反馈图像理解研究

国家自然科学基金

1+阅读 · 2008年12月31日

相关论文

Class-Incremental Exemplar Compression for Class-Incremental Learning

Arxiv

0+阅读 · 2023年3月24日

Finite Volume Approximations for Non-Linear Parabolic Problems with Stochastic Forcing

Arxiv

0+阅读 · 2023年3月23日

Fréchet single index models for object response regression

Arxiv

0+阅读 · 2023年3月22日

Matryoshka Policy Gradient for Entropy-Regularized RL: Convergence and Global Optimality

Arxiv

0+阅读 · 2023年3月22日

Dynamic Relevance Learning for Few-Shot Object Detection

Arxiv

0+阅读 · 2023年3月22日

EasyDGL: Encode, Train and Interpret for Continuous-time Dynamic Graph Learning

Arxiv

0+阅读 · 2023年3月22日

Self-supervised Meta-Prompt Learning with Meta-Gradient Regularization for Few-shot Generalization

Arxiv

0+阅读 · 2023年3月22日

Prompt Distribution Learning

Arxiv

14+阅读 · 2022年5月6日

Few-Shot Graph Classification with Model Agnostic Meta-Learning

Arxiv

23+阅读 · 2020年3月18日

Latent Relation Language Models

Arxiv

21+阅读 · 2019年8月21日

微信扫码咨询专知VIP会员