课程说明
为了实现人工智能的梦想,我们需要学习出可以进行自主决策的系统。强化学习就是实现这一目标的强有力的例子,它与包括机器人、游戏、消费者画像和医疗保健在内的各种任务息息相关。本门课程将详细介绍强化学习领域的基础知识,学生们将会学习到强化学习核心方法和技术,包括如何进行泛化(Generalization)和探索(Exploration)。通过专家讲座、书面课程和线下编码任务相结合的方式,学生将会深入了解强化学习的关键思想和技巧。作业将包括强化学习的基础知识、以及深度强化学习相关知识-这是一个非常有前途的新领域,将深度学习技术与强化学习相结合。此外,通过线下的开放性项目,学生将提升他们对强化学习的理解。
学习目标
在课程结束后,学生应该能够
· 定义强化学习的关键特征,这也是区分AI和非交互式机器学习的关键特征
· 定义MDP,POMDP,bandit,batch offline 强化学习,online 强化学习
· 描述研究 VS 应用的挑战,并比较和对比至少两种方法来应对这一挑战
· 给定一个应用问题(例如,计算机视觉,机器人等)决定是否应该被定为一个强化学习问题,如果是,如何制定,应该采用什么算法来处理这个问题,并证明答案正确性。
· 实现包括深度强化学习算法在内的常见强化学习算法
· 学习分析强化学习算法和评估这些算法的多个标准:例如regret,样本复杂度(sample complexity),计算复杂度,收敛性等。
· 列出强化学习领域中至少两个开放的挑战或热门话题
课程大纲
课程ppt等资料下载地址:
链接: https://pan.baidu.com/s/1bpq7xO7
密码: 公众号回复“SRL”
往期精彩内容分享
《模型汇总-20》深度学习背后的秘密:初学者指南-深度学习激活函数大全
深度学习与NLP 深度学习|机器学习|人工智能 精品视频教程合集分享
模型汇总-12 深度学习中的表示学习_Representation Learning
DeepLearning_NLP
深度学习与NLP
商务合作请联系微信号:lqfarmerlq