推荐免费书｜MIT出版《Reinforcement Learning: An Introduction》

2017 年 12 月 1 日 全球人工智能

推荐这本“增强学习”的书，一共300+页，内容不算最新，但非常全面。Richard S. Sutton and Andrew G. Barto的作品，MIT出版《Reinforcement Learning: An Introduction》，感兴趣的同学可以直接下载使用：

下载地址：https://www.aminer.cn/archive/reinforcement-learning-an-introduction-mit-press/53e9aa23b7602d970338f339

热门文章推荐

震惊！GitHub 上 82% 的代码是重复代码！

中美AI布局:中国巨头们聚焦在离钱最近的AI应用!

招聘｜AI学院长期招聘AI课程讲师（兼职）：日薪5k-10k

浙大才女：用人耳听不到的超声波（攻击）控制语音助手！

Science：最新发现哈希可能是大脑的通用计算原理！

厉害｜波士顿动力新版人形机器人Atlas，后空翻很完美！

吴恩达：AI论文已经够多了，赶紧“搞点事”吧！

厉害了！吉利宣布收购飞行汽车公司Terrafugia ！

周志华：实验表明gcForest是最好的非深度神经网络方法

黑科技｜Adobe出图象技术神器！视频也可以PS了！！

史上第一个被授予公民身份的机器人索菲亚和人对答如流！

登录查看更多

相关内容

强化学习

关注 5437

强化学习（RL）是机器学习的一个领域，与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外，强化学习是三种基本的机器学习范式之一。强化学习与监督学习的不同之处在于，不需要呈现带标签的输入/输出对，也不需要显式纠正次优动作。相反，重点是在探索（未知领域）和利用（当前知识）之间找到平衡。该环境通常以马尔可夫决策过程（MDP）的形式陈述，因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于，后者不假设MDP的确切数学模型，并且针对无法采用精确方法的大型MDP。