170页PPT入门深度强化学习!

2020 年 3 月 8 日 中国图象图形学报
专家讲堂

重点高校教授倾情奉献

聚焦机器学习热点学科

入门级基础理论和关键技术

超级丰富的案例应用

全面系统理清学科脉络

关注我们
共同进步


什么是强化学习?

和其他学习方法相比,有何不同与特色?

深度学习如何与强化学习结合?并各取所长?

深度强化学习会成为未来引领智能计算的方法吗?


本期“专家讲堂”聚焦深度强化学习,带你走进机器学习世界。


图片来源David silver 强化学习公开课


继深度学习与大数据结合产生可观的应用前景之后,人们开始探索深度学习时代的各种新技术方向。


早期的强化学习算法主要解决状态和动作都是离散且数目不超过一定数量的有限序贯决策问题。


然而,很多实际问题中需要处理的状态和动作数量都非常庞大,而且有些任务的状态和动作是连续的,此时使用传统强化学习方法难以取得满意的学习效果。


为打破传统强化学习算法的局限,深度学习被用来解决强化学习问题,并建立相应的深度强化学习理论和方法,通过在强化学习计算框架中引入深度神经网络使得智能体能够感知更为复杂的环境状态并形成更复杂的策略,由此提高强化学习算法的计算能力和泛化能力。


图片来源David silver 强化学习公开课


深度强化学习将强化学习和深度学习有机地结合在一起,使用强化学习方法定义问题和优化目标,使用深度学习方法解决状态表示、策略表示等问题,通过各取所长的方式协同解决复杂问题。


深度强化学习理论和方法为解决复杂系统的感知决策问题提供了新的思路。


深度强化学习已经能够解决一部分在以前看来不可能完成的任务,在游戏博弈、优化控制等领域取得卓越应用成果。很多学者认为深度强化学习将在不久的将来成为一种能够解决复杂问题的通用智能计算方式, 并为人工智能领域带来革命性的变化。



往期推荐阅读


专家开讲 | 机器学习究竟是什么?

118页PPT!机器学习模型参数与优化那些事儿

实战例题!200+PPT带你看懂监督学习

222页PPT!Get神经网络与深度学习的好机会~

200+PPT!带你读懂深度网络模型与机理



接下来,图图用170页PPT介绍深度强化学习的基本理论和方法。


专家介绍



汪荣贵,合肥工业大学计算机与信息学院教授,主要研究方向智能视频处理与分析、车载视觉增强系统、多媒体技术等。E-mail: wangrgui@hfut.edu.cn


全民抗疫我倡议


图图跟大家分享一部BBC纪录片《人体奥妙之细胞暗战》,揭示了我们身体内部细胞和病毒的战斗。


点击图片可观看


这是一场长达数十亿年的战争

至今未分胜负

每天在我们体里

成千上万的小细胞筑起一道道防线

如火如荼 奋勇迎战

甚者不断以自我牺牲阻击病毒

只为守护我们的健康


打赢这场阻击战

需要长期抗战

多做运动 健康饮食

规律作息 调适心态

强健身心

增强抵抗力

全民抗疫 战必胜!


如果您有故事想倾诉,有问题想询问,有经验想分享,欢迎添加下方学报小编微信。




编辑推荐


本文系《中国图象图形学报》独家稿件

内容仅供学习交流

版权属于原作者

欢迎大家关注转发!


编辑:韩小荷

指导:梧桐君

审校:夏薇薇

总编辑:肖   亮


声  明


欢迎转发本号原创内容,任何形式的媒体或机构未经授权,不得转载和摘编。授权请在后台留言“机构名称+文章标题+转载/转发”联系本号。转载需标注原作者和信息来源为《中国图象图形学报》。本号转载信息旨在传播交流,内容为作者观点,不代表本号立场。未经允许,请勿二次转载。如涉及文字、图片等内容、版权和其他问题,请于文章发出20日内联系本号,我们将第一时间处理。《中国图象图形学报》拥有最终解释权。


齐心抗疫

与你同在

前沿 | 观点 | 资讯 | 独家

电话:010-58887030/7035/7418

网站:www.cjig.cn


好看请点这里,好文一起分享
登录查看更多
4

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【硬核课】统计学习理论,321页ppt
专知会员服务
138+阅读 · 2020年6月30日
【牛津大学&DeepMind】自监督学习教程,141页ppt
专知会员服务
179+阅读 · 2020年5月29日
多智能体深度强化学习的若干关键科学问题
专知会员服务
186+阅读 · 2020年5月24日
深度强化学习策略梯度教程,53页ppt
专知会员服务
178+阅读 · 2020年2月1日
【斯坦福新课】CS234:强化学习,附课程PPT下载
专知会员服务
118+阅读 · 2020年1月15日
【强化学习】深度强化学习初学者指南
专知会员服务
179+阅读 · 2019年12月14日
从入门到精通-Tensorflow深度强化学习课程
深度学习与NLP
23+阅读 · 2019年3月7日
深度强化学习入门,这一篇就够了!
机器学习算法与Python学习
27+阅读 · 2018年8月17日
强化学习的入门之旅
机器学习研究会
6+阅读 · 2018年2月12日
公开课 | 强化学习之基础入门
AI100
6+阅读 · 2018年1月7日
【干货】机器学习和深度学习概念入门(下)
机器学习研究会
6+阅读 · 2017年12月31日
深度强化学习小白入门攻略篇
StuQ
5+阅读 · 2017年9月7日
Arxiv
7+阅读 · 2019年5月31日
Learning to Weight for Text Classification
Arxiv
8+阅读 · 2019年3月28日
Accelerated Methods for Deep Reinforcement Learning
Arxiv
6+阅读 · 2019年1月10日
Arxiv
9+阅读 · 2018年4月20日
Arxiv
3+阅读 · 2018年2月22日
VIP会员
相关VIP内容
【硬核课】统计学习理论,321页ppt
专知会员服务
138+阅读 · 2020年6月30日
【牛津大学&DeepMind】自监督学习教程,141页ppt
专知会员服务
179+阅读 · 2020年5月29日
多智能体深度强化学习的若干关键科学问题
专知会员服务
186+阅读 · 2020年5月24日
深度强化学习策略梯度教程,53页ppt
专知会员服务
178+阅读 · 2020年2月1日
【斯坦福新课】CS234:强化学习,附课程PPT下载
专知会员服务
118+阅读 · 2020年1月15日
【强化学习】深度强化学习初学者指南
专知会员服务
179+阅读 · 2019年12月14日
相关资讯
从入门到精通-Tensorflow深度强化学习课程
深度学习与NLP
23+阅读 · 2019年3月7日
深度强化学习入门,这一篇就够了!
机器学习算法与Python学习
27+阅读 · 2018年8月17日
强化学习的入门之旅
机器学习研究会
6+阅读 · 2018年2月12日
公开课 | 强化学习之基础入门
AI100
6+阅读 · 2018年1月7日
【干货】机器学习和深度学习概念入门(下)
机器学习研究会
6+阅读 · 2017年12月31日
深度强化学习小白入门攻略篇
StuQ
5+阅读 · 2017年9月7日
相关论文
Top
微信扫码咨询专知VIP会员