图图Seminar第一次直播,汪荣贵教授的特邀报告“机器学习基本知识体系与入门方法”受到了广大网友的关注和喜爱,汪老师不仅分享了一堂生动形象的入门课程,带大家走进机器学习世界,还与我们约定,将带着机器学习系列课程再次回到图图Seminar。
经过潜心思考和精心准备,汪荣贵教授带着他的倾力之作——强化学习系列直播课程强势回归!本次系列直播课程“强化学习若干知识要点解析”讲义PPT共204页,今天一次全部放送,墙裂推荐机器学习爱好者下载保存,认真浏览,做好笔记,如有疑问,就准备好您的问题,来参加7月底图图Seminar汪荣贵强化学习系列直播,和汪老师互动交流,掌握难点,快速提升!
【方式1】
关注学报微信公众号最新推文
【方式2】
加入图图直播群,绝不错过直播学习好课程
机器学习是一种从经验数据中构造和改善模型的理论与方法,监督学习和无监督学习主要以带标注或不带标注样本数据作为反映外部环境特征的经验数据。除样本数据之外还可使用外部环境的反馈信息作为经验数据构造和改善模型,由此形成一种名为强化学习的机器学习类型。
强化学习又称为再励学习或评价学习,采用类似于人类和动物学习中的试错机制,通过不断获取外部环境的反馈信息优化调整计算模型或动作行为,实现对序贯决策问题的优化求解。由于外部环境反馈信息的形式和内容比样本数据更加灵活广泛且可以在线获取,故强化学习具有非常广泛的应用前景,被认为是一种最接近人类学习行为的学习方法。
很多实际问题中需要处理的状态和动作数量都非常庞大,而且有些任务的状态和动作甚至是连续的,此时使用传统强化学习方法难以取得满意的学习效果。为打破传统强化学习算法的局限,人们使用深度学习方法来解决强化学习问题并建立相应的深度强化学习理论和方法,通过在强化学习计算框架中引入深度神经网络使得智能体能够感知更为复杂的环境状态并形成更复杂的策略,由此提高强化学习算法的计算能力和泛化能力。深度强化学习将强化学习和深度学习有机地结合在一起,使用强化学习方法定义问题和优化目标,使用深度学习方法解决状态表示、策略表示等问题,通过各取所长的方式协同解决复杂问题。
深度强化学习理论和方法为解决复杂系统的感知决策问题提供了新的思路。目前,深度强化学习已经能够解决一部分在以前看来不可能完成的任务,在游戏博弈、机器人控制、汽车智能驾驶、人机交互、过程优化控制等多个领域得到了成功的应用。很多学者认为深度强化学习将在不久的将来成为一种能够解决复杂问题的通用智能计算方式,并为人工智能领域带来革命性的变化。
介绍强化学习的基础知识,包括强化学习的基本概念、马尔可夫模型和动态规划期望方程等,分析讨论策略迭代、价值迭代、时序差分学习和Q学习等传统强化学习方法;
系统地介绍和讨论基于价值的深度强化学习方法和基于策略的深度强化学习方法;
梳理总结强化学习和深度强化学习的基本知识框架、基本学术流派以及未来发展趋势;
深度强化学习应用开发的基本知识和技术要点。
汪荣贵强化学习系列课程的讲义PPT共204页,先一睹为快吧~
专家介绍
汪荣贵,合肥工业大学人工智能学院教授、博士生导师。主要研究方向为嵌入式多媒体技术、图像理解与机器学习、视频大数据与云计算。承担完成多项国家自然基金项目、安徽省科技攻关及企业委托项目,近期研究成果“多源多模态视频智能处理关键技术及应用”获得安徽省科技进步二等奖、“多源多模态视频智能处理在平安城市中的应用”获得合肥市科技进步一等奖、“虚拟卡口”获得中国电子集团科技进步一等奖。主编出版的教材《离散数学及其应用》、《算法设计与应用》和《机器学习及其应用》获得广大读者的好评。
E-mail: wangrgui@hfut.edu.cn
看完微推意犹未尽?扫码加入图图社区,优享报告PPT
中国知网回放地址:
http://k.cnki.net/Room/Home/Index/181822
B站回放地址:
https://space.bilibili.com/27032291
往期目录
汪荣贵——机器学习基本知识体系与入门方法
陈强——从Cell封面论文谈AI研究中的实验数据问题
石争浩——从先验到深度:低见度图像增强
行知论坛——南理工行知论坛&图图Seminar:智能画质增强专题
孙显——遥感图像智能分析:方法与应用
章国锋——视觉SLAM在AR应用的关键性问题探讨
林宙辰——机器学习中优化算法前沿简介
白相志,冯朝路——“医学图像与人工智能”主题论坛
本文系《中国图象图形学报》独家稿件
内容仅供学习交流
版权属于原作者
欢迎大家关注转发!
编辑:韩小荷
指导:梧桐君
审校:夏薇薇
总编辑:肖 亮
声 明
欢迎转发本号原创内容,任何形式的媒体或机构未经授权,不得转载和摘编。授权请在后台留言“机构名称+文章标题+转载/转发”联系本号。转载需标注原作者和信息来源为《中国图象图形学报》。本号转载信息旨在传播交流,内容为作者观点,不代表本号立场。未经允许,请勿二次转载。如涉及文字、图片等内容、版权和其他问题,请于文章发出20日内联系本号,我们将第一时间处理。《中国图象图形学报》拥有最终解释权。