190页pdf伯克利博士论文《自适应持续的具身智能体》，系统全面阐述机器人技术 - 专知VIP

会员服务 ·

34

加州大学伯克利分校 (UC Berkeley) · 博士论文 · 具身人工智能 · 具身智能体 ·

2022 年 8 月 29 日

190页pdf伯克利博士论文《自适应持续的具身智能体》，系统全面阐述机器人技术

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

近年来，人工学习系统在计算机视觉、自然语言处理和语音识别等许多具有挑战性的领域取得了巨大的进展。这些最新进展的一个显著特点是，将灵活的深度函数逼近器与为特定问题收集的大型数据集结合起来，这似乎是一个简单的公式。然而，这些系统在泛化新输入以获取新功能时，很难利用其学习能力，通常需要在类似的大型数据集上从头开始重新训练。这与人类形成了鲜明的对比，人类有一种非凡的能力，可以在之前的经验基础上，从少数几个例子中学习新概念。在本论文的第一部分，我们将研究如何构建系统来模拟这种快速适应新任务的能力。本文这一部分的核心原则之一是，利用大量以前的经验/任务中的结构来实现快速适应和不确定性。首先，我们将研究奖励规范的设置，这是强化学习中的一个常见挑战，接下来，我们将研究元学习设置的概率框架如何能够在不确定性下进行推理。

在本文的第二部分中，鉴于先前的任务数据集在加速学习方面发挥的潜在作用，我们将提出一个自然的问题:如何让智能体完全自主地收集数据。这将消除人类为人工智能“管理”任务数据集的需要，并实现完全可扩展的、永无止境的具身学习。我们所采取的方法的中心主题将是考虑智能体必须解决的在线现实世界“任务”的本质，并通过它重新审视偶发性RL的基本假设。最后，我们将在现实世界灵巧操作领域展示这些想法，并为今后在这种更“自主”的强化学习设置方面的工作提供一些提示。

成为VIP会员查看完整内容

70

相关内容

加州大学伯克利分校 (UC Berkeley)

加州大学伯克利分校 (UC Berkeley)

加州大学伯克利分校（University of California, Berkeley），是美国最负盛名且是最顶尖的一所公立研究型大学，位于旧金山东湾伯克利市的山丘上。创建于1868年，是加州大学十个分校中历史最悠久的一所。加州大学伯克利分校在世界范围内拥有崇高的学术声誉，拥有丰富的教学资源，研究水平非常坚厚，与斯坦福大学、麻省理工学院等一同被誉为美国工程科技界的学术领袖。

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知会员服务

113+阅读 · 2022年10月6日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知会员服务

104+阅读 · 2022年9月19日

【飞行员-战机】《人机接口：为未来驱动的接口设计制定基准》译文，北约2022最新报告

【飞行员-战机】《人机接口：为未来驱动的接口设计制定基准》译文，北约2022最新报告

专知会员服务

83+阅读 · 2022年9月19日

如何稳健决策？MIT最新博士论文《鲁棒决策的端到端学习》234页pdf

如何稳健决策？MIT最新博士论文《鲁棒决策的端到端学习》234页pdf

专知会员服务

105+阅读 · 2022年9月1日

301页pdf伯克利博士论文《可扩展机器人学习》，系统全面阐述机器人技术

301页pdf伯克利博士论文《可扩展机器人学习》，系统全面阐述机器人技术

专知会员服务

36+阅读 · 2022年8月16日

【CMU博士论文】通过记忆的元强化学习，118页pdf

【CMU博士论文】通过记忆的元强化学习，118页pdf

专知会员服务

48+阅读 · 2022年6月23日

【CMU博士论文】通过记忆的元强化学习

【CMU博士论文】通过记忆的元强化学习

专知会员服务

57+阅读 · 2021年10月16日

【牛津大学博士论文】使用多模态深度学习的视频理解

专知会员服务

67+阅读 · 2021年10月15日

最新《持续学习机器人技术：定义，框架，学习策略，机会与挑战》综述论文，17页pdf

最新《持续学习机器人技术：定义，框架，学习策略，机会与挑战》综述论文，17页pdf

专知会员服务

56+阅读 · 2020年12月11日

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知会员服务

108+阅读 · 2020年10月9日

【牛津大学博士论文】多模态概率推理的机器学习预测与协调，173页pdf

【牛津大学博士论文】多模态概率推理的机器学习预测与协调，173页pdf

专知

7+阅读 · 2022年10月16日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

【牛津大学博士论文】神经网络中的无监督学习和连续学习，153页pdf

【牛津大学博士论文】神经网络中的无监督学习和连续学习，153页pdf

专知

6+阅读 · 2022年10月5日

【牛津大学博士论文】多模态自监督学习，172页pdf

【牛津大学博士论文】多模态自监督学习，172页pdf

专知

9+阅读 · 2022年10月4日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

29+阅读 · 2022年9月19日

如何稳健决策？MIT最新博士论文《鲁棒决策的端到端学习》234页pdf

如何稳健决策？MIT最新博士论文《鲁棒决策的端到端学习》234页pdf

专知

4+阅读 · 2022年9月1日

【MIT博士论文】自监督学习语音处理，148页pdf

【MIT博士论文】自监督学习语音处理，148页pdf

专知

8+阅读 · 2022年8月31日

301页pdf伯克利博士论文《可扩展机器人学习》，系统全面阐述机器人技术

301页pdf伯克利博士论文《可扩展机器人学习》，系统全面阐述机器人技术

专知

7+阅读 · 2022年8月16日

《用于控制、探索和安全的样本高效深度强化学习》里尔大学207页博士论文

《用于控制、探索和安全的样本高效深度强化学习》里尔大学207页博士论文

专知

5+阅读 · 2022年7月27日

【博士论文】多任务学习视觉场景理解，140页pdf

【博士论文】多任务学习视觉场景理解，140页pdf

专知

28+阅读 · 2022年4月5日

无人机小型蜂窝网络系统设计与优化控制关键技术研究

国家自然科学基金

31+阅读 · 2017年12月31日

多用途载人航天器时间触发系统的容错和柔性调度方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

执行器故障的大型挠性卫星姿态大角度快速机动容错控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂未建模系统的基于随机逼近的数据驱动控制研究

国家自然科学基金

2+阅读 · 2013年12月31日

可重构核探测系统框架研究

国家自然科学基金

0+阅读 · 2012年12月31日

视觉系统学习和适应的计算模型

国家自然科学基金

1+阅读 · 2012年12月31日

混合动力电动汽车在线学习控制策略研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向微重力环境的宇航员康复训练机器人技术研究

国家自然科学基金

1+阅读 · 2011年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

16+阅读 · 2009年12月31日

嵌入式多媒体流计算的自适应机制与跨层优化

国家自然科学基金

0+阅读 · 2008年12月31日

Configured Grant for Ultra-Reliable and Low-Latency Communications: Standardization and Beyond

Arxiv

0+阅读 · 2022年10月17日

Parametric estimation of stochastic differential equations via online gradient descent

Arxiv

0+阅读 · 2022年10月17日

Dual-Curriculum Teacher for Domain-Inconsistent Object Detection in Autonomous Driving

Arxiv

0+阅读 · 2022年10月17日

Scaling up Trustless DNN Inference with Zero-Knowledge Proofs

Arxiv

0+阅读 · 2022年10月17日

On Trustworthy Decision-Making Process of Human Drivers from the View of Perceptual Uncertainty Reduction

Arxiv

0+阅读 · 2022年10月15日

Monotonicity and Double Descent in Uncertainty Estimation with Gaussian Processes

Arxiv

0+阅读 · 2022年10月14日

Augmentation for Learning From Demonstration with Environmental Constraints

Arxiv

0+阅读 · 2022年10月13日

Beyond backpropagation: implicit gradients for bilevel optimization

Arxiv

0+阅读 · 2022年10月13日

Policy Gradient With Serial Markov Chain Reasoning

Arxiv

0+阅读 · 2022年10月13日

Self-Driving Cars: A Survey

Self-Driving Cars: A Survey

Arxiv

41+阅读 · 2019年1月14日

VIP会员

相关主题

加州大学伯克利分校 (UC Berkeley)

具身人工智能

具身智能体

相关VIP内容

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知会员服务

113+阅读 · 2022年10月6日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知会员服务

104+阅读 · 2022年9月19日

【飞行员-战机】《人机接口：为未来驱动的接口设计制定基准》译文，北约2022最新报告

【飞行员-战机】《人机接口：为未来驱动的接口设计制定基准》译文，北约2022最新报告

专知会员服务

83+阅读 · 2022年9月19日

如何稳健决策？MIT最新博士论文《鲁棒决策的端到端学习》234页pdf

如何稳健决策？MIT最新博士论文《鲁棒决策的端到端学习》234页pdf

专知会员服务

105+阅读 · 2022年9月1日

301页pdf伯克利博士论文《可扩展机器人学习》，系统全面阐述机器人技术

301页pdf伯克利博士论文《可扩展机器人学习》，系统全面阐述机器人技术

专知会员服务

36+阅读 · 2022年8月16日

【CMU博士论文】通过记忆的元强化学习，118页pdf

【CMU博士论文】通过记忆的元强化学习，118页pdf

专知会员服务

48+阅读 · 2022年6月23日

【CMU博士论文】通过记忆的元强化学习

【CMU博士论文】通过记忆的元强化学习

专知会员服务

57+阅读 · 2021年10月16日

【牛津大学博士论文】使用多模态深度学习的视频理解

专知会员服务

67+阅读 · 2021年10月15日

最新《持续学习机器人技术：定义，框架，学习策略，机会与挑战》综述论文，17页pdf

最新《持续学习机器人技术：定义，框架，学习策略，机会与挑战》综述论文，17页pdf

专知会员服务

56+阅读 · 2020年12月11日

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知会员服务

108+阅读 · 2020年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

GPT-5如何对齐？从硬性拒绝到安全完成：走向以输出为中心的安全训练

【伯克利博士论文】超越人类监督的视觉智能

【ICCV2025】SO(3) 上连续非保守动力系统的预测

2025年中国数据要素行业发展研究报告

相关资讯

【牛津大学博士论文】多模态概率推理的机器学习预测与协调，173页pdf

【牛津大学博士论文】多模态概率推理的机器学习预测与协调，173页pdf

专知

7+阅读 · 2022年10月16日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

【牛津大学博士论文】神经网络中的无监督学习和连续学习，153页pdf

【牛津大学博士论文】神经网络中的无监督学习和连续学习，153页pdf

专知

6+阅读 · 2022年10月5日

【牛津大学博士论文】多模态自监督学习，172页pdf

【牛津大学博士论文】多模态自监督学习，172页pdf

专知

9+阅读 · 2022年10月4日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

29+阅读 · 2022年9月19日

如何稳健决策？MIT最新博士论文《鲁棒决策的端到端学习》234页pdf

如何稳健决策？MIT最新博士论文《鲁棒决策的端到端学习》234页pdf

专知

4+阅读 · 2022年9月1日

【MIT博士论文】自监督学习语音处理，148页pdf

【MIT博士论文】自监督学习语音处理，148页pdf

专知

8+阅读 · 2022年8月31日

301页pdf伯克利博士论文《可扩展机器人学习》，系统全面阐述机器人技术

301页pdf伯克利博士论文《可扩展机器人学习》，系统全面阐述机器人技术

专知

7+阅读 · 2022年8月16日

《用于控制、探索和安全的样本高效深度强化学习》里尔大学207页博士论文

《用于控制、探索和安全的样本高效深度强化学习》里尔大学207页博士论文

专知

5+阅读 · 2022年7月27日

【博士论文】多任务学习视觉场景理解，140页pdf

【博士论文】多任务学习视觉场景理解，140页pdf

专知

28+阅读 · 2022年4月5日

相关基金

无人机小型蜂窝网络系统设计与优化控制关键技术研究

国家自然科学基金

31+阅读 · 2017年12月31日

多用途载人航天器时间触发系统的容错和柔性调度方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

执行器故障的大型挠性卫星姿态大角度快速机动容错控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂未建模系统的基于随机逼近的数据驱动控制研究

国家自然科学基金

2+阅读 · 2013年12月31日

可重构核探测系统框架研究

国家自然科学基金

0+阅读 · 2012年12月31日

视觉系统学习和适应的计算模型

国家自然科学基金

1+阅读 · 2012年12月31日

混合动力电动汽车在线学习控制策略研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向微重力环境的宇航员康复训练机器人技术研究

国家自然科学基金

1+阅读 · 2011年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

16+阅读 · 2009年12月31日

嵌入式多媒体流计算的自适应机制与跨层优化

国家自然科学基金

0+阅读 · 2008年12月31日

相关论文

Configured Grant for Ultra-Reliable and Low-Latency Communications: Standardization and Beyond

Arxiv

0+阅读 · 2022年10月17日

Parametric estimation of stochastic differential equations via online gradient descent

Arxiv

0+阅读 · 2022年10月17日

Dual-Curriculum Teacher for Domain-Inconsistent Object Detection in Autonomous Driving

Arxiv

0+阅读 · 2022年10月17日

Scaling up Trustless DNN Inference with Zero-Knowledge Proofs

Arxiv

0+阅读 · 2022年10月17日

On Trustworthy Decision-Making Process of Human Drivers from the View of Perceptual Uncertainty Reduction

Arxiv

0+阅读 · 2022年10月15日

Monotonicity and Double Descent in Uncertainty Estimation with Gaussian Processes

Arxiv

0+阅读 · 2022年10月14日

Augmentation for Learning From Demonstration with Environmental Constraints

Arxiv

0+阅读 · 2022年10月13日

Beyond backpropagation: implicit gradients for bilevel optimization

Arxiv

0+阅读 · 2022年10月13日

Policy Gradient With Serial Markov Chain Reasoning

Arxiv

0+阅读 · 2022年10月13日

Self-Driving Cars: A Survey

Self-Driving Cars: A Survey

Arxiv

41+阅读 · 2019年1月14日

微信扫码咨询专知VIP会员