【强化学习干货】《深度学习与机器人学》大牛Pieter Abbeel 105页PPT下载 - 专知

会员服务 ·

0

【强化学习干货】《深度学习与机器人学》大牛Pieter Abbeel 105页PPT下载

2019 年 1 月 2 日 新智元

新智元报道

作者：Pieter Abbeel

编辑：肖琴

【新智元导读】2019年开启之际，美国加州大学伯克利分校教授、机器人与强化学习领域专家 Pieter Abbeel 发布了一份资源大礼：《深度学习与机器人学》105页PPT。这份PPT整理自Abbeel教授2018年受邀参加的69个演讲，内容涵盖监督学习、强化学习和无监督学习的重要进展，以及深度学习的主要应用等方面，有助于读者对深度学习和机器人学有一个宏观的理解。

Pieter Abbeel教授从AI近年的一些“热论”讲起，从马斯克认为AI是人类文明面临的最大威胁、普京说“谁能成为 AI 领域的领袖，谁就将成为世界的主宰者”，概述了近年来AI的热潮：NIPS等顶会的参会人数达到史上最高、arxiv上AI领域的论文翻倍增长。

报告的主体部分是“深度学习成功”，详细介绍了监督学习、强化学习和无监督学习的重要进展。Pieter Abbeel教授对这三个概念的解释如下：

监督学习：模式识别，如果有足够多的数据(input -> output pairs)，那么神经网络就能够学习模式；
强化学习：通过试错的过程，学习目标导向的行为
无监督学习：没有明确的监督的条件下，学习世界的结构

最后，报告展示了深度学习的一系列应用。

PPT下载地址：

https://www.dropbox.com/s/dw4kmxkrv3orujd/2018_12_xx_Abbeel--AI.pdf?dl=0

Pieter Abbeel教授简介

Pieter Abbeel，加州大学伯克利分校教授、机器人学习实验室主任，伯克利人工智能研究(BAIR)实验室联合主任。

Pieter Abbeel是机器人和强化学习领域的大牛。Pieter Abbeel 2008年从斯坦福大学获得博士学位，师从百度前首席科学家 Andrew Ng（吴恩达），毕业后在UC Berkeley任教。

2016~2017年，Pieter Abbeel加入Open AI，任研究科学家。现在则是Open AI顾问。

Pieter Abbeel还是两家AI公司的创始人，Gradescope和covariant.ai。Gradescope开发为家庭作业、课题研究、试卷等打分的AI系统；covariant.ai开发机器人自动化的AI系统，在制造/仓储/电子商务/物流等领域应用。

Pieter Abbeel 的研究重点特别集中于如何让机器人向人类学习（学徒学习），如何让机器人通过自己的试错过程学习(强化学习)，以及如何通过从learning-to-learn(元学习)过程中加快技能获取。他开发的机器人已经学会了先进的直升机特技飞行、打结、基本装配、叠衣服、移动、以及基于视觉的机器人操作。

机器人叠毛巾

Pieter Abbeel目前的主要研究方向：机器人和机器学习，特别关注深度强化学习、深度模仿学习、深度无监督学习、元学习、learning-to-learn、以及AI安全。

PPT全文

PPT下载地址：

https://www.dropbox.com/s/dw4kmxkrv3orujd/2018_12_xx_Abbeel--AI.pdf?dl=0

【加入社群】

新智元AI技术+产业社群招募中，欢迎对AI技术+产业落地感兴趣的同学，加小助手微信号：aiera2015_2 入群;通过审核后我们将邀请进群，加入社群后务必修改群备注（姓名 - 公司 - 职位;专业群审核较严，敬请谅解）。

登录查看更多

13

相关内容

Pieter Abbeel

Pieter Abbeel是加州大学伯克利分校电子工程和计算机科学教授，伯克利机器人学习实验室主任和伯克利AI研究实验室联合主任。

最新《生成式对抗网络》简介，25页ppt

最新《生成式对抗网络》简介，25页ppt

专知会员服务

176+阅读 · 2020年6月28日

最新《生成式对抗网络》技术综述课程，70页ppt带你学习GAN进展

最新《生成式对抗网络》技术综述课程，70页ppt带你学习GAN进展

专知会员服务

218+阅读 · 2020年6月20日

【伯克利】最新《生成式对抗网络》技术综述课程，257页ppt带你学习GAN进展

【伯克利】最新《生成式对抗网络》技术综述课程，257页ppt带你学习GAN进展

专知会员服务

194+阅读 · 2020年5月3日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

【NeurIPS2019演讲】伯克利Pieter Abbeel，通过元强化学习实现更好的基于模型的RL(Better Model-based RL through Meta RL)

【NeurIPS2019演讲】伯克利Pieter Abbeel，通过元强化学习实现更好的基于模型的RL(Better Model-based RL through Meta RL)

专知会员服务

33+阅读 · 2019年12月13日

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

专知会员服务

34+阅读 · 2019年11月26日

【DeepMind-Nando de Freitas】强化学习教程，102页ppt，Reinforcement Learning

【DeepMind-Nando de Freitas】强化学习教程，102页ppt，Reinforcement Learning

专知会员服务

84+阅读 · 2019年11月15日

【CS294-158 《深度无监督学习》 2019年春】伯克利Pieter Abbeel新开课程（含视频PPT）

【CS294-158 《深度无监督学习》 2019年春】伯克利Pieter Abbeel新开课程（含视频PPT）

专知会员服务

29+阅读 · 2019年11月2日

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

专知会员服务

78+阅读 · 2019年10月27日

【Pieter Abbeel 报告@CMU】元学习与深度强化学习机器人应用，Deep Learning to Learn，84页ppt

【Pieter Abbeel 报告@CMU】元学习与深度强化学习机器人应用，Deep Learning to Learn，84页ppt

专知会员服务

32+阅读 · 2019年10月12日

DeepMind Nando（原牛津大学教授）强化学习最新进展，含图文、公式和代码，附102页PPT下载

DeepMind Nando（原牛津大学教授）强化学习最新进展，含图文、公式和代码，附102页PPT下载

专知

18+阅读 · 2019年11月15日

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

专知

13+阅读 · 2019年10月12日

伯克利深度无监督学习更新 | 第一讲（下）：基于似然的模型: 自回归模型

伯克利深度无监督学习更新 | 第一讲（下）：基于似然的模型: 自回归模型

AI研习社

8+阅读 · 2019年6月20日

【ICML2019】UC伯克利Pieter Abbeel教授强化学习教程-附59页slides

【ICML2019】UC伯克利Pieter Abbeel教授强化学习教程-附59页slides

专知

19+阅读 · 2019年6月17日

《深度无监督学习》伯克利Pieter Abbeel新开课程（含视频PPT）

《深度无监督学习》伯克利Pieter Abbeel新开课程（含视频PPT）

专知

21+阅读 · 2019年2月19日

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

专知

12+阅读 · 2018年12月22日

UC伯克利Pieter Abbeel谈论强化学习-视频

UC伯克利Pieter Abbeel谈论强化学习-视频

专知

7+阅读 · 2018年12月17日

下载 | 193页无监督深度学习PPT教程

下载 | 193页无监督深度学习PPT教程

机器学习算法与Python学习

8+阅读 · 2018年12月5日

资源 | UC Berkeley CS 294深度强化学习课程（附视频、学习资料）

资源 | UC Berkeley CS 294深度强化学习课程（附视频、学习资料）

数据派THU

21+阅读 · 2018年4月7日

学界 | Pieter Abbeel NIPS 2017大会报告《Deep Learning for Robots》（附PDF）

学界 | Pieter Abbeel NIPS 2017大会报告《Deep Learning for Robots》（附PDF）

AI科技评论

4+阅读 · 2017年12月9日

Learning in the Frequency Domain

Learning in the Frequency Domain

Arxiv

11+阅读 · 2020年3月12日

Deep Learning for Learning Graph Representations

Arxiv

35+阅读 · 2020年1月2日

How to train your MAML

Arxiv

26+阅读 · 2019年3月5日

Deep High-Resolution Representation Learning for Human Pose Estimation

Arxiv

5+阅读 · 2019年2月25日

Few-shot Learning with Meta Metric Learners

Arxiv

13+阅读 · 2019年1月26日

The Bottleneck Simulator: A Model-based Deep Reinforcement Learning Approach

The Bottleneck Simulator: A Model-based Deep Reinforcement Learning Approach

Arxiv

11+阅读 · 2018年7月12日

Auto Deep Compression by Reinforcement Learning Based Actor-Critic Structure

Auto Deep Compression by Reinforcement Learning Based Actor-Critic Structure

Arxiv

3+阅读 · 2018年7月8日

Deep Reinforcement Learning: An Overview

Arxiv

15+阅读 · 2018年6月23日

Towards an Engine for Lifelong Interactive Knowledge Learning in Human-Machine Conversations

Arxiv

5+阅读 · 2018年2月16日

A Unified approach for Conventional Zero-shot, Generalized Zero-shot and Few-shot Learning

Arxiv

4+阅读 · 2017年10月26日

VIP会员

相关主题

无监督学习

相关VIP内容

最新《生成式对抗网络》简介，25页ppt

最新《生成式对抗网络》简介，25页ppt

专知会员服务

176+阅读 · 2020年6月28日

最新《生成式对抗网络》技术综述课程，70页ppt带你学习GAN进展

最新《生成式对抗网络》技术综述课程，70页ppt带你学习GAN进展

专知会员服务

218+阅读 · 2020年6月20日

【伯克利】最新《生成式对抗网络》技术综述课程，257页ppt带你学习GAN进展

【伯克利】最新《生成式对抗网络》技术综述课程，257页ppt带你学习GAN进展

专知会员服务

194+阅读 · 2020年5月3日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

【NeurIPS2019演讲】伯克利Pieter Abbeel，通过元强化学习实现更好的基于模型的RL(Better Model-based RL through Meta RL)

【NeurIPS2019演讲】伯克利Pieter Abbeel，通过元强化学习实现更好的基于模型的RL(Better Model-based RL through Meta RL)

专知会员服务

33+阅读 · 2019年12月13日

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

专知会员服务

34+阅读 · 2019年11月26日

【DeepMind-Nando de Freitas】强化学习教程，102页ppt，Reinforcement Learning

【DeepMind-Nando de Freitas】强化学习教程，102页ppt，Reinforcement Learning

专知会员服务

84+阅读 · 2019年11月15日

【CS294-158 《深度无监督学习》 2019年春】伯克利Pieter Abbeel新开课程（含视频PPT）

【CS294-158 《深度无监督学习》 2019年春】伯克利Pieter Abbeel新开课程（含视频PPT）

专知会员服务

29+阅读 · 2019年11月2日

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

专知会员服务

78+阅读 · 2019年10月27日

【Pieter Abbeel 报告@CMU】元学习与深度强化学习机器人应用，Deep Learning to Learn，84页ppt

【Pieter Abbeel 报告@CMU】元学习与深度强化学习机器人应用，Deep Learning to Learn，84页ppt

专知会员服务

32+阅读 · 2019年10月12日

热门VIP内容

开通专知VIP会员享更多权益服务

《俄乌战争背景下俄罗斯的战略性海军分析（2022-2025年）》最新100页报告

【斯坦福博士论文】数据、决策与依赖：构建可信人工智能的挑战

人工智能时代背景下的未来海战

接触战中的无人机优势：美军旅级部队面临的小型无人机系统挑战与调整

相关资讯

DeepMind Nando（原牛津大学教授）强化学习最新进展，含图文、公式和代码，附102页PPT下载

DeepMind Nando（原牛津大学教授）强化学习最新进展，含图文、公式和代码，附102页PPT下载

专知

18+阅读 · 2019年11月15日

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

专知

13+阅读 · 2019年10月12日

伯克利深度无监督学习更新 | 第一讲（下）：基于似然的模型: 自回归模型

伯克利深度无监督学习更新 | 第一讲（下）：基于似然的模型: 自回归模型

AI研习社

8+阅读 · 2019年6月20日

【ICML2019】UC伯克利Pieter Abbeel教授强化学习教程-附59页slides

【ICML2019】UC伯克利Pieter Abbeel教授强化学习教程-附59页slides

专知

19+阅读 · 2019年6月17日

《深度无监督学习》伯克利Pieter Abbeel新开课程（含视频PPT）

《深度无监督学习》伯克利Pieter Abbeel新开课程（含视频PPT）

专知

21+阅读 · 2019年2月19日

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

专知

12+阅读 · 2018年12月22日

UC伯克利Pieter Abbeel谈论强化学习-视频

UC伯克利Pieter Abbeel谈论强化学习-视频

专知

7+阅读 · 2018年12月17日

下载 | 193页无监督深度学习PPT教程

下载 | 193页无监督深度学习PPT教程

机器学习算法与Python学习

8+阅读 · 2018年12月5日

资源 | UC Berkeley CS 294深度强化学习课程（附视频、学习资料）

资源 | UC Berkeley CS 294深度强化学习课程（附视频、学习资料）

数据派THU

21+阅读 · 2018年4月7日

学界 | Pieter Abbeel NIPS 2017大会报告《Deep Learning for Robots》（附PDF）

学界 | Pieter Abbeel NIPS 2017大会报告《Deep Learning for Robots》（附PDF）

AI科技评论

4+阅读 · 2017年12月9日

相关论文

Learning in the Frequency Domain

Learning in the Frequency Domain

Arxiv

11+阅读 · 2020年3月12日

Deep Learning for Learning Graph Representations

Arxiv

35+阅读 · 2020年1月2日

How to train your MAML

Arxiv

26+阅读 · 2019年3月5日

Deep High-Resolution Representation Learning for Human Pose Estimation

Arxiv

5+阅读 · 2019年2月25日

Few-shot Learning with Meta Metric Learners

Arxiv

13+阅读 · 2019年1月26日

The Bottleneck Simulator: A Model-based Deep Reinforcement Learning Approach

The Bottleneck Simulator: A Model-based Deep Reinforcement Learning Approach

Arxiv

11+阅读 · 2018年7月12日

Auto Deep Compression by Reinforcement Learning Based Actor-Critic Structure

Auto Deep Compression by Reinforcement Learning Based Actor-Critic Structure

Arxiv

3+阅读 · 2018年7月8日

Deep Reinforcement Learning: An Overview

Arxiv

15+阅读 · 2018年6月23日

Towards an Engine for Lifelong Interactive Knowledge Learning in Human-Machine Conversations

Arxiv

5+阅读 · 2018年2月16日

A Unified approach for Conventional Zero-shot, Generalized Zero-shot and Few-shot Learning

Arxiv

4+阅读 · 2017年10月26日

大家都在搜

大型语言模型

蓝牙安全攻防

朱克爱德华兹家族

【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络（DCRNN）

微信扫码咨询专知VIP会员