专访 || 大佬Pieter Abbeel谈深度强化学习

2020 年 2 月 2 日 深度强化学习实验室

深度强化学习实验室报道

作者:DeepRL


确认过头发,是大佬!


|| 关于Pieter Abbeel

Pieter Abbeel 教授是加州大学伯克利分校机器人与强化学习范畴的教授。他于比利时 KU Leuven 获电子工程学士、硕士学位,之后在斯坦福大学师从吴恩达,并于 2008 年取得博士学位。Pieter Abbeel 教授自 2008 年起在加州大学伯克利分校担任 教职。在攻读博士期间,Pieter Abbeel 教授发表了多篇重要的学术论文,并与导师吴恩达提出了学徒学习(Apprenticeship learning) 这一增强学习的全新概念。2011 年,Pieter Abbeel 教授通过深度神经网络应用策略搜寻所,实现了机器人叠毛巾的演示,他也因而被MIT Technology Review 评比为当年的“TR35”获奖者。Pieter Abbeel 教授同时担任创业公司 Embodied Intelligence 的董事长兼首 席科学家。其研究领域为:机器学习和机器人技术领域,他的研究集中让机器人从人身上 学习(学徒学习),通过自己的尝试和错误学习(强化学习),以及通过学习-学习 (元学习)加速技能的获取。"

个人主页:http://people.eecs.berkeley.edu/~pabbeel/



Pieter Abbeel访谈:深度强化学习

MIT AI: Deep Reinforcement Learning (Pieter Abbeel) 

YouTube:  http://t.cn/EUDN6HP

Bilibili: https://www.bilibili.com/video/av38419065



第47篇:全网首发最全深度强化学习资料(永更)

第46篇:30+个必知的《人工智能》会议清单

第45篇:2019年-57篇深度强化学习文章汇总

第44篇:深度强化学习入门到精通资料综述

第43篇:顶会征稿 ||  ICAPS2020: DeepRL

第42篇:实习生招聘 || 华为诺亚方舟实验室

第41篇:滴滴实习生|| 深度强化学习方向

第40篇:AAAI-2020 || 52篇深度强化学习论文

第39篇:Call For Papers# IJCNN2020-DeepRL

第38篇:DQN系列(2): Double DQN 算法

第37篇:DQN系列(1): Double Q-learning

第36篇:从Paper到Coding, DRL挑战34类游戏

第35篇:复现"深度强化学习"论文的经验之谈

第34篇:α-Rank算法之DeepMind及Huawei改进

第33篇:DeepMind-102页深度强化学习PPT

第32篇:腾讯AI Lab强化学习招聘(正式/实习)

第31篇:强化学习,路在何方?

第30篇:强化学习的三种范例

第29篇:框架ES-MAML:进化策略的元学习方法

第28篇:138页“策略优化”PPT--Pieter Abbeel

第27篇:迁移学习在强化学习中的应用及最新进展

第26篇:深入理解Hindsight Experience Replay

第25篇:10项【深度强化学习】赛事汇总

第24篇:DRL实验中到底需要多少个随机种子?

第23篇:142页"ICML会议"强化学习笔记

第22篇:通过深度强化学习实现通用量子控制

第21篇:《深度强化学习》面试题汇总

第20篇:《深度强化学习》招聘汇总(13家企业)

第19篇:解决反馈稀疏问题之HER原理与代码实现

第18篇:"DeepRacer" —顶级深度强化学习挑战赛

第17篇:AI Paper | 几个实用工具推荐

第16篇:AI领域:如何做优秀研究并写高水平论文?

第15篇: DeepMind开源三大新框架!
第14篇: 61篇NIPS2019深度强化学习论文及部分解读
第13篇: OpenSpiel(28种DRL环境+24种DRL算法)
第12篇: 模块化和快速原型设计的Huskarl DRL框架
第11篇: DRL在Unity自行车环境中配置与实践
第10篇: 解读72篇DeepMind深度强化学习论文
第9篇: 《AutoML》:一份自动化调参的指导
第8篇: ReinforceJS库(动态展示DP、TD、DQN)
第7篇: 10年NIPS顶会DRL论文(100多篇)汇总
第6篇: ICML2019-深度强化学习文章汇总
第5篇: 深度强化学习在阿里巴巴的技术演进
第4篇: 深度强化学习十大原则
第3篇: “超参数”自动化设置方法---DeepHyper
第2篇: 深度强化学习的加速方法
第1篇: 深入浅出解读"多巴胺(Dopamine)论文"、环境配置和实例分析


第13期论文:2020-1-21(共7篇)

第12期论文:2020-1-10(Pieter Abbeel一篇,共6篇)

第11期论文:2019-12-19(3篇,一篇OpennAI)

第10期论文:2019-12-13(8篇)

第9期论文:2019-12-3(3篇)

第8期论文:2019-11-18(5篇)

第7期论文:2019-11-15(6篇)

第6期论文:2019-11-08(2篇)

第5期论文:2019-11-07(5篇,一篇DeepMind发表)

第4期论文:2019-11-05(4篇)

第3期论文:2019-11-04(6篇)

第2期论文:2019-11-03(3篇)

第1期论文:2019-11-02(5篇)


登录查看更多
1

相关内容

Pieter Abbeel是加州大学伯克利分校电子工程和计算机科学教授,伯克利机器人学习实验室主任和伯克利AI研究实验室联合主任。
知识图谱推理,50页ppt,Salesforce首席科学家Richard Socher
专知会员服务
105+阅读 · 2020年6月10日
深度强化学习策略梯度教程,53页ppt
专知会员服务
178+阅读 · 2020年2月1日
2019必读的十大深度强化学习论文
专知会员服务
57+阅读 · 2020年1月16日
UC伯克利Pieter Abbeel谈论强化学习-视频
专知
7+阅读 · 2018年12月17日
【RL前沿】深度强化学习的最新进展
量化投资与机器学习
8+阅读 · 2017年12月18日
强化学习族谱
CreateAMind
26+阅读 · 2017年8月2日
Generalization and Regularization in DQN
Arxiv
6+阅读 · 2019年1月30日
Deep Reinforcement Learning: An Overview
Arxiv
17+阅读 · 2018年11月26日
Arxiv
3+阅读 · 2018年10月5日
Hierarchical Deep Multiagent Reinforcement Learning
Arxiv
8+阅读 · 2018年9月25日
Arxiv
11+阅读 · 2018年4月25日
VIP会员
Top
微信扫码咨询专知VIP会员