专访 || 大佬Pieter Abbeel谈深度强化学习 - 专知

会员服务 ·

0

专访 || 大佬Pieter Abbeel谈深度强化学习

2020 年 2 月 2 日 深度强化学习实验室

深度强化学习实验室报道

作者：DeepRL

确认过头发，是大佬！

|| 关于Pieter Abbeel

Pieter Abbeel 教授是加州大学伯克利分校机器人与强化学习范畴的教授。他于比利时 KU Leuven 获电子工程学士、硕士学位，之后在斯坦福大学师从吴恩达，并于 2008 年取得博士学位。Pieter Abbeel 教授自 2008 年起在加州大学伯克利分校担任教职。在攻读博士期间，Pieter Abbeel 教授发表了多篇重要的学术论文，并与导师吴恩达提出了学徒学习(Apprenticeship learning) 这一增强学习的全新概念。2011 年，Pieter Abbeel 教授通过深度神经网络应用策略搜寻所，实现了机器人叠毛巾的演示，他也因而被MIT Technology Review 评比为当年的“TR35”获奖者。Pieter Abbeel 教授同时担任创业公司 Embodied Intelligence 的董事长兼首席科学家。其研究领域为:机器学习和机器人技术领域，他的研究集中让机器人从人身上学习(学徒学习)，通过自己的尝试和错误学习(强化学习)，以及通过学习-学习 (元学习)加速技能的获取。"

个人主页：http://people.eecs.berkeley.edu/~pabbeel/

Pieter Abbeel访谈：深度强化学习

MIT AI: Deep Reinforcement Learning (Pieter Abbeel)

YouTube: http://t.cn/EUDN6HP

Bilibili: https://www.bilibili.com/video/av38419065

完

第47篇：全网首发最全深度强化学习资料(永更)

第46篇：30+个必知的《人工智能》会议清单

第45篇：2019年-57篇深度强化学习文章汇总

第44篇：深度强化学习入门到精通资料综述

第43篇：顶会征稿 || ICAPS2020: DeepRL

第42篇：实习生招聘 || 华为诺亚方舟实验室

第41篇：滴滴实习生|| 深度强化学习方向

第40篇：AAAI-2020 || 52篇深度强化学习论文

第39篇：Call For Papers# IJCNN2020-DeepRL

第38篇：DQN系列(2): Double DQN 算法

第37篇：DQN系列(1): Double Q-learning

第36篇：从Paper到Coding, DRL挑战34类游戏

第35篇：复现"深度强化学习"论文的经验之谈

第34篇：α-Rank算法之DeepMind及Huawei改进

第33篇：DeepMind-102页深度强化学习PPT

第32篇：腾讯AI Lab强化学习招聘(正式/实习)

第31篇：强化学习，路在何方？

第30篇：强化学习的三种范例

第29篇：框架ES-MAML：进化策略的元学习方法

第28篇：138页“策略优化”PPT--Pieter Abbeel

第27篇：迁移学习在强化学习中的应用及最新进展

第26篇：深入理解Hindsight Experience Replay

第25篇：10项【深度强化学习】赛事汇总

第24篇：DRL实验中到底需要多少个随机种子？

第23篇：142页"ICML会议"强化学习笔记

第22篇：通过深度强化学习实现通用量子控制

第21篇：《深度强化学习》面试题汇总

第20篇：《深度强化学习》招聘汇总(13家企业）

第19篇：解决反馈稀疏问题之HER原理与代码实现

第18篇："DeepRacer" —顶级深度强化学习挑战赛

第17篇：AI Paper | 几个实用工具推荐

第16篇：AI领域：如何做优秀研究并写高水平论文？

第15篇： DeepMind开源三大新框架！

第14篇： 61篇NIPS2019深度强化学习论文及部分解读

第13篇： OpenSpiel(28种DRL环境+24种DRL算法)

第12篇：模块化和快速原型设计的Huskarl DRL框架

第11篇： DRL在Unity自行车环境中配置与实践

第10篇：解读72篇DeepMind深度强化学习论文

第9篇：《AutoML》：一份自动化调参的指导

第8篇： ReinforceJS库（动态展示DP、TD、DQN）

第7篇： 10年NIPS顶会DRL论文(100多篇)汇总

第6篇： ICML2019-深度强化学习文章汇总

第5篇：深度强化学习在阿里巴巴的技术演进

第4篇：深度强化学习十大原则

第3篇： “超参数”自动化设置方法---DeepHyper

第2篇：深度强化学习的加速方法

第1篇：深入浅出解读"多巴胺（Dopamine）论文"、环境配置和实例分析

第13期论文：2020-1-21(共7篇)

第12期论文：2020-1-10(Pieter Abbeel一篇,共6篇)

第11期论文：2019-12-19(3篇，一篇OpennAI)

第10期论文：2019-12-13(8篇)

第9期论文：2019-12-3(3篇)

第8期论文：2019-11-18(5篇)

第7期论文：2019-11-15(6篇)

第6期论文：2019-11-08(2篇)

第5期论文：2019-11-07(5篇，一篇DeepMind发表)

第4期论文：2019-11-05(4篇)

第3期论文：2019-11-04(6篇)

第2期论文：2019-11-03(3篇)

第1期论文：2019-11-02(5篇)

登录查看更多

1

相关内容

Pieter Abbeel

Pieter Abbeel是加州大学伯克利分校电子工程和计算机科学教授，伯克利机器人学习实验室主任和伯克利AI研究实验室联合主任。

知识图谱推理，50页ppt，Salesforce首席科学家Richard Socher

知识图谱推理，50页ppt，Salesforce首席科学家Richard Socher

专知会员服务

111+阅读 · 2020年6月10日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

2019必读的十大深度强化学习论文

2019必读的十大深度强化学习论文

专知会员服务

59+阅读 · 2020年1月16日

【强化学习轻松入门】《Reinforcement Learning 101》，Shweta Bhatt

【强化学习轻松入门】《Reinforcement Learning 101》，Shweta Bhatt

专知会员服务

50+阅读 · 2020年1月3日

【NeurIPS2019演讲】伯克利Pieter Abbeel，通过元强化学习实现更好的基于模型的RL(Better Model-based RL through Meta RL)

【NeurIPS2019演讲】伯克利Pieter Abbeel，通过元强化学习实现更好的基于模型的RL(Better Model-based RL through Meta RL)

专知会员服务

33+阅读 · 2019年12月13日

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

专知会员服务

34+阅读 · 2019年11月26日

【微软Alekh等开放新书】强化学习理论与算法（Reinforcement Learning:Theory and Algorithms），附83页pdf

【微软Alekh等开放新书】强化学习理论与算法（Reinforcement Learning:Theory and Algorithms），附83页pdf

专知会员服务

121+阅读 · 2019年11月24日

【经典图书】机器学习基础，427页pdf Foundations of machine learning

【经典图书】机器学习基础，427页pdf Foundations of machine learning

专知会员服务

158+阅读 · 2019年11月14日

【CS294-158 《深度无监督学习》 2019年春】伯克利Pieter Abbeel新开课程（含视频PPT）

【CS294-158 《深度无监督学习》 2019年春】伯克利Pieter Abbeel新开课程（含视频PPT）

专知会员服务

29+阅读 · 2019年11月2日

【Pieter Abbeel 报告@CMU】元学习与深度强化学习机器人应用，Deep Learning to Learn，84页ppt

【Pieter Abbeel 报告@CMU】元学习与深度强化学习机器人应用，Deep Learning to Learn，84页ppt

专知会员服务

32+阅读 · 2019年10月12日

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

专知

13+阅读 · 2019年10月12日

伯克利深度无监督学习更新 | 第一讲（下）：基于似然的模型: 自回归模型

伯克利深度无监督学习更新 | 第一讲（下）：基于似然的模型: 自回归模型

AI研习社

8+阅读 · 2019年6月20日

【ICML2019】UC伯克利Pieter Abbeel教授强化学习教程-附59页slides

【ICML2019】UC伯克利Pieter Abbeel教授强化学习教程-附59页slides

专知

19+阅读 · 2019年6月17日

《深度无监督学习》伯克利Pieter Abbeel新开课程（含视频PPT）

《深度无监督学习》伯克利Pieter Abbeel新开课程（含视频PPT）

专知

21+阅读 · 2019年2月19日

【强化学习干货】《深度学习与机器人学》大牛Pieter Abbeel 105页PPT下载

【强化学习干货】《深度学习与机器人学》大牛Pieter Abbeel 105页PPT下载

新智元

13+阅读 · 2019年1月2日

UC伯克利Pieter Abbeel谈论强化学习-视频

UC伯克利Pieter Abbeel谈论强化学习-视频

专知

7+阅读 · 2018年12月17日

资源 | 台大李宏毅教授最新课程，深度强化学习有国语版啦！

资源 | 台大李宏毅教授最新课程，深度强化学习有国语版啦！

大数据文摘

20+阅读 · 2018年6月13日

【RL前沿】深度强化学习的最新进展

【RL前沿】深度强化学习的最新进展

量化投资与机器学习

8+阅读 · 2017年12月18日

学界 | Pieter Abbeel NIPS 2017大会报告《Deep Learning for Robots》（附PDF）

学界 | Pieter Abbeel NIPS 2017大会报告《Deep Learning for Robots》（附PDF）

AI科技评论

4+阅读 · 2017年12月9日

强化学习族谱

强化学习族谱

CreateAMind

26+阅读 · 2017年8月2日

Multimodal Intelligence: Representation Learning, Information Fusion, and Applications

Arxiv

78+阅读 · 2019年11月10日

Playing Text-Adventure Games with Graph-Based Deep Reinforcement Learning

Playing Text-Adventure Games with Graph-Based Deep Reinforcement Learning

Arxiv

5+阅读 · 2019年3月25日

Generalization and Regularization in DQN

Generalization and Regularization in DQN

Arxiv

6+阅读 · 2019年1月30日

Deep Reinforcement Learning: An Overview

Deep Reinforcement Learning: An Overview

Arxiv

17+阅读 · 2018年11月26日

Reinforcement Learning with Perturbed Rewards

Arxiv

4+阅读 · 2018年10月5日

Hierarchical Deep Multiagent Reinforcement Learning

Hierarchical Deep Multiagent Reinforcement Learning

Arxiv

8+阅读 · 2018年9月25日

Generalizing Across Multi-Objective Reward Functions in Deep Reinforcement Learning

Generalizing Across Multi-Objective Reward Functions in Deep Reinforcement Learning

Arxiv

5+阅读 · 2018年9月17日

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

Arxiv

4+阅读 · 2018年8月17日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

Zero-Resource Neural Machine Translation with Multi-Agent Communication Game

Arxiv

4+阅读 · 2018年2月9日

VIP会员

相关主题

深度强化学习

加州大学 (University of California)

相关VIP内容

知识图谱推理，50页ppt，Salesforce首席科学家Richard Socher

知识图谱推理，50页ppt，Salesforce首席科学家Richard Socher

专知会员服务

111+阅读 · 2020年6月10日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

2019必读的十大深度强化学习论文

2019必读的十大深度强化学习论文

专知会员服务

59+阅读 · 2020年1月16日

【强化学习轻松入门】《Reinforcement Learning 101》，Shweta Bhatt

【强化学习轻松入门】《Reinforcement Learning 101》，Shweta Bhatt

专知会员服务

50+阅读 · 2020年1月3日

【NeurIPS2019演讲】伯克利Pieter Abbeel，通过元强化学习实现更好的基于模型的RL(Better Model-based RL through Meta RL)

【NeurIPS2019演讲】伯克利Pieter Abbeel，通过元强化学习实现更好的基于模型的RL(Better Model-based RL through Meta RL)

专知会员服务

33+阅读 · 2019年12月13日

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

专知会员服务

34+阅读 · 2019年11月26日

【微软Alekh等开放新书】强化学习理论与算法（Reinforcement Learning:Theory and Algorithms），附83页pdf

【微软Alekh等开放新书】强化学习理论与算法（Reinforcement Learning:Theory and Algorithms），附83页pdf

专知会员服务

121+阅读 · 2019年11月24日

【经典图书】机器学习基础，427页pdf Foundations of machine learning

【经典图书】机器学习基础，427页pdf Foundations of machine learning

专知会员服务

158+阅读 · 2019年11月14日

【CS294-158 《深度无监督学习》 2019年春】伯克利Pieter Abbeel新开课程（含视频PPT）

【CS294-158 《深度无监督学习》 2019年春】伯克利Pieter Abbeel新开课程（含视频PPT）

专知会员服务

29+阅读 · 2019年11月2日

【Pieter Abbeel 报告@CMU】元学习与深度强化学习机器人应用，Deep Learning to Learn，84页ppt

【Pieter Abbeel 报告@CMU】元学习与深度强化学习机器人应用，Deep Learning to Learn，84页ppt

专知会员服务

32+阅读 · 2019年10月12日

热门VIP内容

开通专知VIP会员享更多权益服务

《多智能体不确定环境追逃博弈研究》216页

美智库最新发布《解放军"人机编组协同作战"发展路径：理论与实践》53页

现代战争"杀伤区"理论：空间尺度与结构特征、控制手段与毁伤机制、生存策略与战线转移

《俄军无人机创新技术或已在乌克兰达成"战场空中封锁"作战效果》最新18页报告

相关资讯

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

专知

13+阅读 · 2019年10月12日

伯克利深度无监督学习更新 | 第一讲（下）：基于似然的模型: 自回归模型

伯克利深度无监督学习更新 | 第一讲（下）：基于似然的模型: 自回归模型

AI研习社

8+阅读 · 2019年6月20日

【ICML2019】UC伯克利Pieter Abbeel教授强化学习教程-附59页slides

【ICML2019】UC伯克利Pieter Abbeel教授强化学习教程-附59页slides

专知

19+阅读 · 2019年6月17日

《深度无监督学习》伯克利Pieter Abbeel新开课程（含视频PPT）

《深度无监督学习》伯克利Pieter Abbeel新开课程（含视频PPT）

专知

21+阅读 · 2019年2月19日

【强化学习干货】《深度学习与机器人学》大牛Pieter Abbeel 105页PPT下载

【强化学习干货】《深度学习与机器人学》大牛Pieter Abbeel 105页PPT下载

新智元

13+阅读 · 2019年1月2日

UC伯克利Pieter Abbeel谈论强化学习-视频

UC伯克利Pieter Abbeel谈论强化学习-视频

专知

7+阅读 · 2018年12月17日

资源 | 台大李宏毅教授最新课程，深度强化学习有国语版啦！

资源 | 台大李宏毅教授最新课程，深度强化学习有国语版啦！

大数据文摘

20+阅读 · 2018年6月13日

【RL前沿】深度强化学习的最新进展

【RL前沿】深度强化学习的最新进展

量化投资与机器学习

8+阅读 · 2017年12月18日

学界 | Pieter Abbeel NIPS 2017大会报告《Deep Learning for Robots》（附PDF）

学界 | Pieter Abbeel NIPS 2017大会报告《Deep Learning for Robots》（附PDF）

AI科技评论

4+阅读 · 2017年12月9日

强化学习族谱

强化学习族谱

CreateAMind

26+阅读 · 2017年8月2日

相关论文

Multimodal Intelligence: Representation Learning, Information Fusion, and Applications

Arxiv

78+阅读 · 2019年11月10日

Playing Text-Adventure Games with Graph-Based Deep Reinforcement Learning

Playing Text-Adventure Games with Graph-Based Deep Reinforcement Learning

Arxiv

5+阅读 · 2019年3月25日

Generalization and Regularization in DQN

Generalization and Regularization in DQN

Arxiv

6+阅读 · 2019年1月30日

Deep Reinforcement Learning: An Overview

Deep Reinforcement Learning: An Overview

Arxiv

17+阅读 · 2018年11月26日

Reinforcement Learning with Perturbed Rewards

Arxiv

4+阅读 · 2018年10月5日

Hierarchical Deep Multiagent Reinforcement Learning

Hierarchical Deep Multiagent Reinforcement Learning

Arxiv

8+阅读 · 2018年9月25日

Generalizing Across Multi-Objective Reward Functions in Deep Reinforcement Learning

Generalizing Across Multi-Objective Reward Functions in Deep Reinforcement Learning

Arxiv

5+阅读 · 2018年9月17日

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms

Arxiv

4+阅读 · 2018年8月17日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

Zero-Resource Neural Machine Translation with Multi-Agent Communication Game

Arxiv

4+阅读 · 2018年2月9日

大家都在搜

久别重逢话双塔

软件无线电

论文浅尝 - ICLR2020 | 通过神经逻辑归纳学习有效地解释

微信扫码咨询专知VIP会员