汪荣贵《深度强化学习》直播课程讲义(204页PPT)

2020 年 7 月 14 日 中国图象图形学报

图图Seminar第一次直播,汪荣贵教授的特邀报告“机器学习基本知识体系与入门方法”受到了广大网友的关注和喜爱,汪老师不仅分享了一堂生动形象的入门课程,带大家走进机器学习世界,还与我们约定,将带着机器学习系列课程再次回到图图Seminar。

图图Seminar01 | 汪荣贵教授,一课入门机器学习

直播回放 | 机器学习基本知识体系与入门方法



经过潜心思考和精心准备,汪荣贵教授带着他的倾力之作——强化学习系列直播课程强势回归!本次系列直播课程“强化学习若干知识要点解析”讲义PPT共204页,今天一次全部放送,墙裂推荐机器学习爱好者下载保存,认真浏览,做好笔记,如有疑问,就准备好您的问题,来参加7月底图图Seminar汪荣贵强化学习系列直播,和汪老师互动交流,掌握难点,快速提升!


如何获取直播最新消息?

【方式1】

关注学报微信公众号最新推文

【方式2】

加入图图直播群,绝不错过直播学习好课程


什么是强化学习?


机器学习是一种从经验数据中构造和改善模型的理论与方法,监督学习和无监督学习主要以带标注或不带标注样本数据作为反映外部环境特征的经验数据。除样本数据之外还可使用外部环境的反馈信息作为经验数据构造和改善模型,由此形成一种名为强化学习的机器学习类型。


强化学习又称为再励学习或评价学习,采用类似于人类和动物学习中的试错机制,通过不断获取外部环境的反馈信息优化调整计算模型或动作行为,实现对序贯决策问题的优化求解。由于外部环境反馈信息的形式和内容比样本数据更加灵活广泛且可以在线获取,故强化学习具有非常广泛的应用前景,被认为是一种最接近人类学习行为的学习方法。


深度学习+强化学习=?


很多实际问题中需要处理的状态和动作数量都非常庞大,而且有些任务的状态和动作甚至是连续的,此时使用传统强化学习方法难以取得满意的学习效果。为打破传统强化学习算法的局限,人们使用深度学习方法来解决强化学习问题并建立相应的深度强化学习理论和方法,通过在强化学习计算框架中引入深度神经网络使得智能体能够感知更为复杂的环境状态并形成更复杂的策略,由此提高强化学习算法的计算能力和泛化能力。深度强化学习将强化学习和深度学习有机地结合在一起,使用强化学习方法定义问题和优化目标,使用深度学习方法解决状态表示、策略表示等问题,通过各取所长的方式协同解决复杂问题。


深度强化学习理论和方法为解决复杂系统的感知决策问题提供了新的思路。目前,深度强化学习已经能够解决一部分在以前看来不可能完成的任务,在游戏博弈、机器人控制、汽车智能驾驶、人机交互、过程优化控制等多个领域得到了成功的应用。很多学者认为深度强化学习将在不久的将来成为一种能够解决复杂问题的通用智能计算方式,并为人工智能领域带来革命性的变化。


强化学习系列直播精彩看点


  • 介绍强化学习的基础知识,包括强化学习的基本概念、马尔可夫模型和动态规划期望方程等,分析讨论策略迭代、价值迭代、时序差分学习和Q学习等传统强化学习方法;

  • 系统地介绍和讨论基于价值的深度强化学习方法和基于策略的深度强化学习方法;

  • 梳理总结强化学习和深度强化学习的基本知识框架、基本学术流派以及未来发展趋势;

  • 深度强化学习应用开发的基本知识和技术要点。


汪荣贵强化学习系列课程的讲义PPT共204页,先一睹为快吧~





专家介绍



汪荣贵,合肥工业大学人工智能学院教授、博士生导师。主要研究方向为嵌入式多媒体技术、图像理解与机器学习、视频大数据与云计算。承担完成多项国家自然基金项目、安徽省科技攻关及企业委托项目,近期研究成果“多源多模态视频智能处理关键技术及应用”获得安徽省科技进步二等奖、“多源多模态视频智能处理在平安城市中的应用”获得合肥市科技进步一等奖、“虚拟卡口”获得中国电子集团科技进步一等奖。主编出版的教材《离散数学及其应用》、《算法设计与应用》和《机器学习及其应用》获得广大读者的好评。

E-mail: wangrgui@hfut.edu.cn





看完微推意犹未尽?扫码加入图图社区,优享报告PPT


"图图Seminar" 直播活动

中国知网回放地址:

http://k.cnki.net/Room/Home/Index/181822

B站回放地址:

https://space.bilibili.com/27032291


往期目录

汪荣贵——机器学习基本知识体系与入门方法

陈强——从Cell封面论文谈AI研究中的实验数据问题

石争浩——从先验到深度:低见度图像增强

行知论坛——南理工行知论坛&图图Seminar:智能画质增强专题

孙显——遥感图像智能分析:方法与应用

章国锋——视觉SLAM在AR应用的关键性问题探讨

林宙辰——机器学习中优化算法前沿简介

白相志,冯朝路—“医学图像与人工智能”主题论坛


     好文推荐

前沿进展 | 多媒体信号处理的数学理论

中国卫星遥感回首与展望

单目深度估计方法:现状与前瞻

目标跟踪40年,什么才是未来?

10篇CV综述速览计算机视觉新进展

算法集锦 | 深度学习在遥感图像处理中的六大应用

封面故事 | 从传统到深度:火灾烟雾识别综述

封面故事 | 光场数据压缩综述

学者观点 | 结合深度学习和半监督学习的遥感影像分类

编辑推荐 | 视频 + 地图!四维信息助力实景中国

深度学习+图像降噪,如何解决“卡脖子”问题?


❂ 专家报告

专家推荐|高维数据表示:由稀疏先验到深度模型

专家报告 | AI与影像“术”——医学影像在新冠肺炎中的应用

专家推荐|真假难辨还是虚幻迷离,参与介质图形绘制让人惊叹!

学者推荐 | 深度学习与高光谱图像分类【内含PPT 福利】

专家报告|深度学习+图像多模态融合

专家报告 | 类脑智能与类脑计算

实战例题!200+PPT带你看懂监督学习

118页PPT!机器学习模型参数与优化那些事儿~

专家开讲 | 机器学习究竟是什么?


❂ 论文写作

羡慕别人中了顶会?做到这些你也可以!

如何阅读一篇文献?

共享 | SAR图像船舶切片数据集

资源分享| 不知道如何获取最新的算法资讯?快来这里看一看

资源分享|热门IT资讯号推荐



本文系《中国图象图形学报》独家稿件

内容仅供学习交流

版权属于原作者

欢迎大家关注转发!


编辑:韩小荷

指导:梧桐君

审校:夏薇薇

总编辑:肖   亮




声  明


欢迎转发本号原创内容,任何形式的媒体或机构未经授权,不得转载和摘编。授权请在后台留言“机构名称+文章标题+转载/转发”联系本号。转载需标注原作者和信息来源为《中国图象图形学报》。本号转载信息旨在传播交流,内容为作者观点,不代表本号立场。未经允许,请勿二次转载。如涉及文字、图片等内容、版权和其他问题,请于文章发出20日内联系本号,我们将第一时间处理。《中国图象图形学报》拥有最终解释权。


我就知道你“在看”



登录查看更多
2

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【康奈尔】最新《强化学习基础》CS 6789课程
专知会员服务
67+阅读 · 2020年9月27日
【伯克利-Ke Li】学习优化,74页ppt,Learning to Optimize
专知会员服务
40+阅读 · 2020年7月23日
【ICML2020】基于模型的强化学习方法教程,279页ppt
专知会员服务
126+阅读 · 2020年7月20日
斯坦福EE364a《凸优化》课件,301页ppt
专知会员服务
95+阅读 · 2020年7月14日
【牛津大学&DeepMind】自监督学习教程,141页ppt
专知会员服务
179+阅读 · 2020年5月29日
少标签数据学习,54页ppt
专知会员服务
196+阅读 · 2020年5月22日
强化学习和最优控制的《十个关键点》81页PPT汇总
专知会员服务
103+阅读 · 2020年3月2日
【斯坦福&Google】面向机器人的机器学习,63页PPT
专知会员服务
24+阅读 · 2019年11月19日
【干货】强化学习介绍
专知
12+阅读 · 2018年6月24日
【团队新作】深度强化学习进展: 从AlphaGo到AlphaGo Zero
中国科学院自动化研究所
17+阅读 · 2018年1月31日
公开课 | 强化学习之基础入门
AI100
6+阅读 · 2018年1月7日
深度强化学习小白入门攻略篇
StuQ
5+阅读 · 2017年9月7日
Risk-Aware Active Inverse Reinforcement Learning
Arxiv
7+阅读 · 2019年1月8日
Neural Approaches to Conversational AI
Arxiv
8+阅读 · 2018年12月13日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
6+阅读 · 2018年4月24日
VIP会员
相关VIP内容
【康奈尔】最新《强化学习基础》CS 6789课程
专知会员服务
67+阅读 · 2020年9月27日
【伯克利-Ke Li】学习优化,74页ppt,Learning to Optimize
专知会员服务
40+阅读 · 2020年7月23日
【ICML2020】基于模型的强化学习方法教程,279页ppt
专知会员服务
126+阅读 · 2020年7月20日
斯坦福EE364a《凸优化》课件,301页ppt
专知会员服务
95+阅读 · 2020年7月14日
【牛津大学&DeepMind】自监督学习教程,141页ppt
专知会员服务
179+阅读 · 2020年5月29日
少标签数据学习,54页ppt
专知会员服务
196+阅读 · 2020年5月22日
强化学习和最优控制的《十个关键点》81页PPT汇总
专知会员服务
103+阅读 · 2020年3月2日
【斯坦福&Google】面向机器人的机器学习,63页PPT
专知会员服务
24+阅读 · 2019年11月19日
相关资讯
【干货】强化学习介绍
专知
12+阅读 · 2018年6月24日
【团队新作】深度强化学习进展: 从AlphaGo到AlphaGo Zero
中国科学院自动化研究所
17+阅读 · 2018年1月31日
公开课 | 强化学习之基础入门
AI100
6+阅读 · 2018年1月7日
深度强化学习小白入门攻略篇
StuQ
5+阅读 · 2017年9月7日
相关论文
Top
微信扫码咨询专知VIP会员