【回顾】北交大博士:强化学习与策略评估

2017 年 11 月 11 日 AI研习社 不灵叔

  活动回顾

分享主题:Reinforcement learning and policy evaluation(强化学习与策略评估)

分享人:汪跃,北京交通大学数学系三年级博士生,专业为概率论与数理统计,导师是马志明院士。 他的研究兴趣在于机器学习、优化算法、强化学习的算法设计和算法理论分析。 在此之前,他于2015年在北京交通大学理学院院获得学士学位。 他现在微软亚洲研究院机器学习组实习。

强化学习(Reinforcement learning)在近几年收到越来越多的关注,对于强化学习的理论探讨也一直是研究热点。这次分享,我们将一起探讨强化学习的理论框架。在此基础上,策略评估(policy evaluation)是强化学习中最基础也是最重要的一个组成部分,其收敛性质的分析对于理解和改进这一类算法非常重要。但是如果只停留在一些非常理想化的假设下,得到的结果往往难以令人信服。在这次要分享的一个工作中,我们将给出一类策略评估算法在一些更贴近实际的假定下(RL天然的数据不独立同分布性,步长多种设置方式等 )的收敛速率分析结果,从而更加确切的回答了关于这一类算法收敛性质的疑问,并且提供了解决类似问题的一个可用的理论工具。


11月8日(周三)晚20:00  AI 研习社微信群


▷ 观看完整回顾大概需要  65  分钟


新人福利


关注 AI 研习社(okweiwu),回复  1  领取

【超过 1000G 神经网络 / AI / 大数据,教程,论文】


公开课精彩往期回顾

复旦Ph.D沈志强:用于目标检测的DSOD模型(ICCV 2017)

极限元刘斌:深度学习在语音生成问题上的典型应用

搜狗文仕学:基于深度学习的语音分离

Video ++孙兆民:视频内容识别行业分析

悉尼科大王超岳:基于生成对抗网络的图像编辑方法

达观数据张健:文本分类方法和应用案例 

清华Ph.D王书浩:基于深度学习的电商交易欺诈检测系统

Twitter工程师王东:详解YOLO2与YOLO9000目标检测系统

Kaggle比赛金牌团队:图像比赛的通用套路有哪些?

宜远智能刘凯:显著降低模型训练成本的主动增量学习


更多课程欢迎点击链接观看

▼▼▼

登录查看更多
4

相关内容

【清华大学】低资源语言:回顾综述和未来的挑战,14页pdf
最新《经济学中的强化学习》2020大综述,42页pdf128篇文献
深度强化学习策略梯度教程,53页ppt
专知会员服务
178+阅读 · 2020年2月1日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
深度学习系列之三:循环神经网络 | 公开课
AI研习社
6+阅读 · 2017年12月2日
【回顾】深度学习系列之二:卷积神经网络
AI研习社
20+阅读 · 2017年12月1日
【回顾】深度学习之星:GAN的原理
AI研习社
5+阅读 · 2017年11月27日
深度学习之星:GAN的原理 | 公开课
AI研习社
7+阅读 · 2017年11月22日
【回顾】深度学习在语音增强方向上的前沿研究
AI研习社
7+阅读 · 2017年11月20日
【回顾】AI小白的机器学习入门之路
AI研习社
5+阅读 · 2017年11月16日
【回顾】Deep Learning读书分享:卷积网络
AI研习社
4+阅读 · 2017年11月15日
【回顾】机器学习中的数学基础
AI研习社
6+阅读 · 2017年11月7日
【回顾】医学影像计算与分析
AI研习社
5+阅读 · 2017年11月5日
Optimization for deep learning: theory and algorithms
Arxiv
104+阅读 · 2019年12月19日
Object Detection in 20 Years: A Survey
Arxiv
48+阅读 · 2019年5月13日
ViZDoom Competitions: Playing Doom from Pixels
Arxiv
5+阅读 · 2018年9月10日
Arxiv
4+阅读 · 2018年5月4日
VIP会员
相关资讯
深度学习系列之三:循环神经网络 | 公开课
AI研习社
6+阅读 · 2017年12月2日
【回顾】深度学习系列之二:卷积神经网络
AI研习社
20+阅读 · 2017年12月1日
【回顾】深度学习之星:GAN的原理
AI研习社
5+阅读 · 2017年11月27日
深度学习之星:GAN的原理 | 公开课
AI研习社
7+阅读 · 2017年11月22日
【回顾】深度学习在语音增强方向上的前沿研究
AI研习社
7+阅读 · 2017年11月20日
【回顾】AI小白的机器学习入门之路
AI研习社
5+阅读 · 2017年11月16日
【回顾】Deep Learning读书分享:卷积网络
AI研习社
4+阅读 · 2017年11月15日
【回顾】机器学习中的数学基础
AI研习社
6+阅读 · 2017年11月7日
【回顾】医学影像计算与分析
AI研习社
5+阅读 · 2017年11月5日
Top
微信扫码咨询专知VIP会员