一般来说,机器学习分为监督学习(Supervised learning),非监督学习(Unsupervised learning)以及强化学习(Reinforcement learning)三类。与监督学习,非监督学习不同,强化学习是一种多阶段的接收环境反馈的机器学习方法。强化学习的学习目标是从环境状态到行为映射关系,从而使得系统的一系列行为从环境中获得的累计奖赏最大(损失最小)。
有人说“深度强化学习(DRL,Deep Reinforcement learning)是实现人工智能(AI,Artificial Intelligence)最可行的解决方案。未来十年它将影响我们每一个人的生活、工作和学习。”在这种观点下,深度强化学习就是人工智能,人工智能就是深度强化学习,二者是等价的。
强化学习的应用范围非常广泛,人们可以利用强化学习来控制直升机的飞行姿态,使得直升机可以按照既定的路线飞行;也可以利用强化学习来控制机器人,使机器人保持站立状态,不会摔倒;还可以利用强化学习学习打游戏,下围棋,学习之后的算法能够完爆人类能力,前一阵子,最火爆的 AlphaGo 其实就是这个领域最好的见证。
基于此,我们邀请了香港理工大学计算机系博士——Traffas 带大家“1小时入门深度强化学习”,这门课针对有一定基础的小伙伴,如果你有一定的Python基础(点击阅读原文,我们也会有Python的内容推荐),将会更好的理解这门课的内容。
想报名的同学,快添加下方海报中二维码吧~
长按二维码,添加小助手,得到听课地址~