因太火而开源的深度强化学习一书,作者来在线讲课了

2022 年 2 月 23 日 机器之心


北京时间2月25日,本书作者丁子涵博士将带来线上分享,围绕深度强化学习基础知识与研究应用展开讨论。


得益于 DeepMind AlphaGo 和 OpenAI Five 成功的案例,深度强化学习受到大量的关注,相关技术广泛应用于不同的领域。但是,对于一名学习者来说,市面上很少有书籍或者教程能同时覆盖从「0 到 1」和「从 1 到 N」的深度强化学习内容,学习材料非常零散。


为了克服这一难题,北京大学前沿计算研究中心助理教授董豪博士等编写了一本名为《Deep Reinforcement Learning: Foundamentals, Research and Applications》的英文书籍。该书于 2020 年 6 月由 Springer 发行,纸质版和电子版销售量都很大,电子版本下载量已经超过了 8 万册。


由于反响比较热烈,很多读者都表示希望能有中文(简体)版本,还有港台地区的同学反映希望能有繁体字版本。因此,他们就把书翻译成了中文简体和繁体,并于 2021 年 6 月和 2022 年 1 月发行。其中,中文简体第一版一经发行已售罄,现已发行第二版。




整本书共分为三个部分,覆盖了学习深度强化学习所需的所有内容。第一部分(基础部分)介绍了强化学习的基础知识、常用的深度强化学习算法及其实现方法:第二部分对精选的深度强化学习研究方向展开介绍,这对希望开展相关研究的读者非常有意义。第三部分仔细地讲述了大量应用的实现细节,例如机器人学习跑步、机械臂控制、下围棋、多智能体平台等等,并提供相关的开源代码。


可以看到,无论你是计算机科学专业背景、希望从零开始学习深度强化学习并开展研究课题和实践项目的学生,还是没有很强的机器学习背景、但是希望快速学习深度强化学习并将其应用到具体产品中的软件工程师,这本书都能帮到你。


目前,该书中文简体版已开放下载:https://deepreinforcementlearningbook.org/


为了帮忙读者更好的了解本书内容,2月25日20:00-21:00,机器之心邀请到本书作者丁子涵博士带来详细介绍。



分享主题:深度强化学习基础知识与研究应用

分享嘉宾:丁子涵是普林斯顿大学博士,于 2019 年获得英国帝国理工学院硕士学位,曾在北京 Inspir.ai、加拿大 Borealis AI、腾讯 Robotics X 实验室有过工作实习经历。本科就读中国科学技术大学,获物理和计算机双学位。研究方向主要涉及强化学习、机器人控制、计算机视觉等。在 ICRA, IROS, NeurIPS, AAAI, IJCAI, Physical Review 等顶级期刊与会议发表多篇论文,是 TensorLayer-RLzoo、TensorLet 和 Arena 等开源代码库的贡献者。

分享摘要:本次分享将围绕深度强化学习基础知识与研究应用展开讨论,包括基本概念、强化学习算法类别、常用强化学习算法等,其次将介绍强化学习研究中的挑战和一些研究思路与交叉方向,最后将讨论深度强化学习的一些实用案例与潜在应用方向。

分享时间:北京时间2月25日20:00-21:00

直播间:关注机动组视频号,北京时间2月25日开播。

交流群: 本次直播设有 QA 环节,欢迎加入本次直播交流群探讨交流。
如群已超出人数限制,请添加机器之心小助手:syncedai2、syncedai3、syncedai4 或 syncedai5,备注「深度强化学习」即可加入。

机器之心 · 机动组

机动组是机器之心发起的人工智能技术社区,聚焦于学术研究与技术实践主题内容,为社区用户带来技术线上公开课、学术分享、技术实践、走近顶尖实验室等系列内容。机动组也将不定期举办线下学术交流会与组织人才服务、产业技术对接等活动欢迎所有 AI 领域技术从业者加入

  • 点击阅读原文,访问机动组官网,观看往期回顾

  • 关注机动组服务号,获取每周直播预告

登录查看更多
4

相关内容

深度强化学习 (DRL) 是一种使用深度学习技术扩展传统强化学习方法的一种机器学习方法。 传统强化学习方法的主要任务是使得主体根据从环境中获得的奖赏能够学习到最大化奖赏的行为。然而,传统无模型强化学习方法需要使用函数逼近技术使得主体能够学习出值函数或者策略。在这种情况下,深度学习强大的函数逼近能力自然成为了替代人工指定特征的最好手段并为性能更好的端到端学习的实现提供了可能。
专知会员服务
27+阅读 · 2021年7月20日
专知会员服务
52+阅读 · 2020年12月24日
《深度学习》圣经花书的数学推导、原理与Python代码实现
【斯坦福新课】CS234:强化学习,附课程PPT下载
专知会员服务
114+阅读 · 2020年1月15日
专知会员服务
198+阅读 · 2019年8月30日
李沐《动手学深度学习》, PyTorch 版源代码已开源,附书籍和代码下载链接
资源 | 《深度强化学习》手稿开放了!
THU数据派
16+阅读 · 2018年10月24日
国家自然科学基金
1+阅读 · 2018年9月23日
国家自然科学基金
5+阅读 · 2017年6月30日
国家自然科学基金
2+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
43+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
12+阅读 · 2019年3月14日
Arxiv
31+阅读 · 2018年11月13日
A Survey on Deep Transfer Learning
Arxiv
11+阅读 · 2018年8月6日
A Multi-Objective Deep Reinforcement Learning Framework
Arxiv
25+阅读 · 2018年1月24日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2018年9月23日
国家自然科学基金
5+阅读 · 2017年6月30日
国家自然科学基金
2+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
43+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员