强化学习(Reinforcement Learning),AlphaGo背后的神秘力量!
RL本质上是可用于序列决策的一种工具,最初源于增强学习及神经网络的结合,并因深度学习时代而复兴!
得益于大数据的普及、计算能力的提升及新的算法技术,我们正见证着强化学习的诸多突破性进展及其在人工智能领域具有革命性的全新架构及应用——包括深度 Q 网络、可微分神经计算机、异步方法、对抗网络架构、价值迭代网络、用于机器翻译的双学习、口语对话系统、信息提取、 引导性策略搜索、 生成对抗模仿学习、非监督的强化及辅助学习及神经架构设计等。
本课程为炼数成金【强化学习系列】开山之作,将从一篇CVPR2019满分文章的解读开始。这篇精彩绝伦而且可能代表人工智能未来风向标的技术,很遗憾作者并没有提供其开源代码!课程将结合其算法思想、算法设计与实现步骤等细节,引导学员逐步实现强化学习与机器视觉的结合,并尝试与自然语言处理的进一步融合(作者实现的部分)。课程规划主要分为算法原理讲解和工程技术实战两个部分,通俗易懂,分级探索工程应用。
课程大纲:
Step 1. 强化学习与目标检测
第一课,经典算法:零基础入门,通俗易懂地讲解强化学习与目标检测的基本原理;
第二课,工程实战:算法实现过程中的遗留问题处理和解决,代码讲解与工程技术实战演示!
Step 2. 强化学习与目标分类
第三课,经典算法:零基础入门,通俗易懂地讲解强化学习与目标分类的基本原理;
第四课,工程实战:算法实现过程中的遗留问题处理和解决,代码讲解与工程技术实战演示!
Step 3. 强化学习与目标识别
第五课,经典算法:零基础入门,通俗易懂地讲解强化学习与目标识别的基本原理;
第六课,工程实战:算法实现过程中的遗留问题处理和解决,代码讲解与工程技术实战演示!
Step 4. 强化学习与目标跟踪
第七课,经典算法:零基础入门,通俗易懂地讲解强化学习与目标跟踪的基本原理;
第八课,工程实战:算法实现过程中的遗留问题处理和解决,代码讲解与工程技术实战演示!
Step 5. 视觉+自然语言指令
第九课,经典算法:零基础入门,通俗易懂地讲解强化学习与视听导航的算法原理;
第十课,工程实战:算法实现过程中的遗留问题处理和解决,代码讲解与工程技术实战演示!
授课时间:
课程将于2019年7月6日开课,预计课程持续时间为12周
课程基础:零基础
学习环境:
windows,Linux
课程软件:
MATLAB 2018b,Python版
收获预期:
深入理解,融会贯通跨境追踪的关键技术!
讲师介绍:
王文峰
哈工大机器人(合肥)国际创新研究院类脑智能研究中心主任,视频监控领域精准安防(Precision Security)概念提出者,国家自然科学基金(面上项目)评审专家,兼任电子工业出版社“机器视觉与类脑智能丛书”总编、长期从事数学跨学科应用研究,目前已涉及地理信息系统、人工智能、机器人、安防等多个领域,并应邀担任一系列SCI期刊(包括部分top期刊)审稿专家和部分权威期刊专题主编。
点击下方二维码或阅读原文报名课程: