深度强化学习实验室报道
作者: DeepRL
来源: rlchina.org
发起人汪军老师寄语:
RLChina 2020强化学习夏令营,是我和国内几位老师自发组织的。为国内强化学习领域的学子、学者,提供为期两周的强化学习公开课程。
Q: 为什么会发起此次公开课程夏令营?
一是看到因为疫情的影响,大部分学生一直没法去学校,希望通过在线公开课的形式,为学生提供更多优质的学习资源。学习和了解人工智能领域的一些新鲜和基础的知识。
二是希望促进学术交流。我们邀请的授课老师都是在强化学习和相关领域有所建树的年轻老师和学者,他们会带来不光是基础课程,更希望结合基础,深入浅出地介绍一些他们的科研成果。也希望激发学生的兴趣,加入到我们研究的行列里面来。当然也欢迎工业界的同行参与,促进学术和联合。
Q:此次强化学习夏令营的课程有什么特点?
我们在课程设计中秉持“深度与广度兼具”的原则,在大家接受的情况下,在教授基础算法的同时也包括后面的理论基础和数学原理。大家可以看到,我们有较多地融入了多智能体强化学习,目前比较热门但是算法基础又薄弱的方向,这是各个院系目前课程中比较少见的,也希望引起学生的得重视,加入到我们研究中来。
课程安排
讲师介绍
报名方式
夏令营官网: rlchina.org(点击 阅读原文)
夏令营对于所有同学、学者公开开放,
扫描下方二维码进入报名入口:
课程形式
ZOOM、B站同步直播
*报名成功后,课程通知与直播链接会通过邮件形式发送,请务必及时查收。
完
总结3: 《强化学习导论》代码/习题答案大全
总结6: 万字总结 || 强化学习之路
完
第73篇:Tensorflow2.0实现29种深度强化学习算法
第72篇:【万字长文】解决强化学习"稀疏奖励"
第71篇:【公开课】高级强化学习专题
第70篇:DeepMind发布"离线强化学习基准“
第66篇:分布式强化学习框架Acme,并行性加强
第65篇:DQN系列(3): 优先级经验回放(PER)
第64篇:UC Berkeley开源RAD来改进强化学习算法
第61篇:David Sliver 亲自讲解AlphaGo、Zero
第59篇:Agent57在所有经典Atari 游戏中吊打人类
第58篇:清华开源「天授」强化学习平台
第57篇:Google发布"强化学习"框架"SEED RL"
第53篇:TRPO/PPO提出者John Schulman谈科研
第52篇:《强化学习》可复现性和稳健性,如何解决?
第51篇:强化学习和最优控制的《十个关键点》
第50篇:微软全球深度强化学习开源项目开放申请
第49篇:DeepMind发布强化学习库 RLax
第48篇:AlphaStar过程详解笔记
第47篇:Exploration-Exploitation难题解决方法
第45篇:DQN系列(1): Double Q-learning
第44篇:科研界最全工具汇总
第42篇:深度强化学习入门到精通资料综述
第41篇:顶会征稿 || ICAPS2020: DeepRL
第40篇:实习生招聘 || 华为诺亚方舟实验室
第39篇:滴滴实习生|| 深度强化学习方向
第37篇:Call For Papers# IJCNN2020-DeepRL
第36篇:复现"深度强化学习"论文的经验之谈
第35篇:α-Rank算法之DeepMind及Huawei改进
第34篇:从Paper到Coding, DRL挑战34类游戏
第31篇:强化学习,路在何方?
第30篇:强化学习的三种范例
第29篇:框架ES-MAML:进化策略的元学习方法
第28篇:138页“策略优化”PPT--Pieter Abbeel
第27篇:迁移学习在强化学习中的应用及最新进展
第26篇:深入理解Hindsight Experience Replay
第25篇:10项【深度强化学习】赛事汇总
第24篇:DRL实验中到底需要多少个随机种子?
第23篇:142页"ICML会议"强化学习笔记
第22篇:通过深度强化学习实现通用量子控制
第21篇:《深度强化学习》面试题汇总
第20篇:《深度强化学习》招聘汇总(13家企业)
第19篇:解决反馈稀疏问题之HER原理与代码实现
第17篇:AI Paper | 几个实用工具推荐
第16篇:AI领域:如何做优秀研究并写高水平论文?
第14期论文: 2020-02-10(8篇)
第13期论文:2020-1-21(共7篇)
第12期论文:2020-1-10(Pieter Abbeel一篇,共6篇)
第11期论文:2019-12-19(3篇,一篇OpennAI)
第10期论文:2019-12-13(8篇)
第9期论文:2019-12-3(3篇)
第8期论文:2019-11-18(5篇)
第7期论文:2019-11-15(6篇)
第6期论文:2019-11-08(2篇)
第5期论文:2019-11-07(5篇,一篇DeepMind发表)
第4期论文:2019-11-05(4篇)
第3期论文:2019-11-04(6篇)
第2期论文:2019-11-03(3篇)
第1期论文:2019-11-02(5篇)