SFFAI 34 报名通知 | 《强化学习》 书籍共读

2019 年 6 月 17 日 人工智能前沿讲习班



SFFAI报名通知

论坛主题

Reinforcement Learning: An Introduction 共读活动


论坛讲者


任民,中国科学院自动化研究所在读博士,本科毕业于国防科技大学,研究兴趣为生物特征识别。


题目:Chapter 3: Finite Markov Decision Processes

摘要:In this chapter we introduce the formal problem of finite Markov decision processes, or finite MDPs, which we try to solve in the rest of the book. This problem involves evaluative feedback, as in bandits, but also an associative aspect—choosing different actions in different situations. MDPs are a classical formalization of sequential decision making, where actions influence not just immediate rewards, but also subsequent situations, or states, and through those future rewards. Thus, MDPs involve delayed reward and the need to trade off immediate and delayed reward. Whereas in bandit problems we estimated the value q⇤(a) of each action a, in MDPs we estimate the value q⇤(s, a) of each action a in each states, or we estimate the value v⇤(s) of each state given optimal action selections. These state-dependent quantities are essential to accurately assigning credit for long-term consequences to individual action selections.

Spotlight:

  1. 从形象走向抽象,给出强化学习的形式化描述;

  2. 建立基于马尔科夫过程的数学模型。



书籍共读


2019小目标,带你读完Reinforcement Learning: An Introduction。

强化学习在方兴未艾的人工智能发展中占据着重要的地位,也是近年来的研究热点。本书是强化学习的经典入门读本,从强化学习ABC直到现实应用的直通车。

书籍共读活动带你从零开始阅读经典,与志趣相投的小伙伴们一起讨论交流。


共读书籍和代码地址:

https://github.com/RenMin1991/Reinforcement_Learning_an_Introduction



报名须知

时间

2019年6月23日(周日)

09:00 -- 11:00


地点

中国科学院自动化所


报名方式

扫描二维码获取报名链接


活动名额/注意事项

请童鞋们添加小助手并说明:“姓名+报名SFFAI34+研究方向”,可获取报名链接,因为同时添加的人数过多,请大家耐心等待。

1、为确保小范围深入交流,本次活动名额有限;

2、活动采取审核制报名,我们将根据用户研究方向与当期主题的契合度进行筛选,通过审核的用户将收到确认邮件;

3、如您无法按时到场参与活动,请于活动开始前 24 小时在AIDL微信公众号后台留言告知,留言格式为放弃报名 + 报名电话。无故缺席者,将不再享有后续活动的报名资格。



SFFAI招募召集人!

现代科学技术高度社会化,在科学理论与技术方法上更加趋向综合与统一,为了满足人工智能不同领域研究者相互交流、彼此启发的需求,我们发起了SFFAI这个公益活动。SFFAI每周举行一期线下活动,邀请一线科研人员分享、讨论人工智能各个领域的前沿思想和最新成果,使专注于各个细分领域的研究者开拓视野、触类旁通。

SFFAI自2018年9月16日举办第一期线下交流,每周一期,风雨无阻,截至目前已举办33期线下交流活动,共有64位讲者分享了他们的真知灼见,来自100多家单位的同学参与了现场交流,通过线上推文、网络直播等形式,50000+人次参与了SFFAI的活动。SFFAI已经成为人工智能学生交流的第一品牌,有一群志同道合的研究生Core-Member伙伴,有一批乐于分享的SPEAKER伙伴,还有许多认可活动价值、多次报名参加现场交流的观众。

我们邀请你一起来组织SFFAI主题论坛,加入SFFAI召集人团队。每个召集人负责1-2期SFFAI主题论坛的组织筹划,我们有一个SFFAI-CORE团队来支持你。一个人付出力所能及,创造一个一己之力不可及的自由丰盛。你带着你的思想,带着你的个性,来组织你感兴趣的SFFAI主题论坛。

当召集人有什么好处?

谁可以当召集人?

怎样才能成为召集人?

为什么要当召集人?

了解我们,加入我们,请点击下方海报!


历史文章推荐


若您觉得此篇推文不错,麻烦点点在看↓↓

登录查看更多
2

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【圣经书】《强化学习导论(2nd)》电子书与代码,548页pdf
专知会员服务
201+阅读 · 2020年5月22日
《强化学习》简介小册,24页pdf
专知会员服务
272+阅读 · 2020年4月19日
【哈佛《CS50 Python人工智能入门》课程 (2020)】
专知会员服务
111+阅读 · 2020年4月12日
强化学习和最优控制的《十个关键点》81页PPT汇总
专知会员服务
103+阅读 · 2020年3月2日
深度强化学习策略梯度教程,53页ppt
专知会员服务
178+阅读 · 2020年2月1日
【开源书】PyTorch深度学习起步,零基础入门(附pdf下载)
专知会员服务
110+阅读 · 2019年10月26日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
MIT新书《强化学习与最优控制》
专知会员服务
275+阅读 · 2019年10月9日
机器学习在材料科学中的应用综述,21页pdf
专知会员服务
48+阅读 · 2019年9月24日
SFFAI 27 报名通知 | 图神经网络
人工智能前沿讲习班
19+阅读 · 2019年5月7日
强化学习精品书籍
平均机器
24+阅读 · 2019年1月2日
SFFAI 16 报名通知 | 视频生成
人工智能前沿讲习班
8+阅读 · 2018年12月30日
SFFAI15报名通知 | 目标检测专题
人工智能前沿讲习班
4+阅读 · 2018年12月18日
SFFAI13 报名通知 | 图神经网络最新进展及挑战
人工智能前沿讲习班
11+阅读 · 2018年12月10日
SFFAI11 报名通知 | 图像分割专题
人工智能前沿讲习班
9+阅读 · 2018年11月26日
SFFAI10 报名通知 | 优化算法论坛
人工智能前沿讲习班
4+阅读 · 2018年11月19日
Continual Unsupervised Representation Learning
Arxiv
7+阅读 · 2019年10月31日
Arxiv
7+阅读 · 2019年4月8日
Arxiv
7+阅读 · 2018年12月26日
Image Captioning based on Deep Reinforcement Learning
Multi-task Deep Reinforcement Learning with PopArt
Arxiv
4+阅读 · 2018年9月12日
Arxiv
5+阅读 · 2018年6月5日
Arxiv
5+阅读 · 2018年4月22日
VIP会员
相关VIP内容
【圣经书】《强化学习导论(2nd)》电子书与代码,548页pdf
专知会员服务
201+阅读 · 2020年5月22日
《强化学习》简介小册,24页pdf
专知会员服务
272+阅读 · 2020年4月19日
【哈佛《CS50 Python人工智能入门》课程 (2020)】
专知会员服务
111+阅读 · 2020年4月12日
强化学习和最优控制的《十个关键点》81页PPT汇总
专知会员服务
103+阅读 · 2020年3月2日
深度强化学习策略梯度教程,53页ppt
专知会员服务
178+阅读 · 2020年2月1日
【开源书】PyTorch深度学习起步,零基础入门(附pdf下载)
专知会员服务
110+阅读 · 2019年10月26日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
MIT新书《强化学习与最优控制》
专知会员服务
275+阅读 · 2019年10月9日
机器学习在材料科学中的应用综述,21页pdf
专知会员服务
48+阅读 · 2019年9月24日
相关资讯
SFFAI 27 报名通知 | 图神经网络
人工智能前沿讲习班
19+阅读 · 2019年5月7日
强化学习精品书籍
平均机器
24+阅读 · 2019年1月2日
SFFAI 16 报名通知 | 视频生成
人工智能前沿讲习班
8+阅读 · 2018年12月30日
SFFAI15报名通知 | 目标检测专题
人工智能前沿讲习班
4+阅读 · 2018年12月18日
SFFAI13 报名通知 | 图神经网络最新进展及挑战
人工智能前沿讲习班
11+阅读 · 2018年12月10日
SFFAI11 报名通知 | 图像分割专题
人工智能前沿讲习班
9+阅读 · 2018年11月26日
SFFAI10 报名通知 | 优化算法论坛
人工智能前沿讲习班
4+阅读 · 2018年11月19日
相关论文
Continual Unsupervised Representation Learning
Arxiv
7+阅读 · 2019年10月31日
Arxiv
7+阅读 · 2019年4月8日
Arxiv
7+阅读 · 2018年12月26日
Image Captioning based on Deep Reinforcement Learning
Multi-task Deep Reinforcement Learning with PopArt
Arxiv
4+阅读 · 2018年9月12日
Arxiv
5+阅读 · 2018年6月5日
Arxiv
5+阅读 · 2018年4月22日
Top
微信扫码咨询专知VIP会员