人工智能 (AI) 应用为我们的生活带来了敏捷性和现代性,而增强学习技术正处于这项技术的前沿。在策略游戏、创意组合和自主运动方面,它可以超越人类竞争者。更重要的是,它刚开始改变我们的文明。 本书介绍了AI的基础知识,详述了机器学习技术,并探索了增强学习的各个方面,以教育性和插图的方式介绍最新概念。它面向那些希望成为技术进步一部分的学生,以及参与开发创新应用的教授,帮助他们应对学术和工业上的挑战。

理解增强学习的基础知识将使你能够:

  • 理解关键的AI概念
  • 获得专业经验
  • 解释序列决策问题,并使用增强学习来解决它们
  • 了解Q-Learning算法如何工作
  • 使用带有注释的Python代码进行实践
  • 找到有利的方向

这本书涵盖了人工智能的基本概念,穿越了机器学习并深入探讨了RL,既有理论又有实践。在各章节中,有用虚线标出的灰色信息块,这些信息块提供了工具和补充信息的链接,作为技巧并扩展了本书的资源。本书的组织始终从总览转向更为具体的视角。每一章也是如此。因此,学生可以按顺序阅读,或根据需要及时参考各章,如下:

第1章介绍人工智能的研究领域,以及区分各种机器学习方法和它们解决的问题类型。通过有趣的例子生动地介绍了增强学习的含义,并解释了其框架。然后,探讨了渗透多个科学领域的相关历史里程碑,这些里程碑对这一研究方向的发展做出了贡献。

第2章涵盖了理解涉及增强学习的整个系统所需的基本知识。讨论了如代理、环境、动作、奖励、策略和价值函数等概念。提供了例子和类比来帮助解释这些概念,从Markov链的问题结构开始,经过Watkins和Dayan的提议,展开为Bellman方程。最后,介绍了在这一创新研究领域中取得成功的算法的类别和特点。

第3章描述了增强学习中最常用的算法之一——Q-Learning算法的逐步操作。呈现了算法的每个组件的含义及其通过伪代码的演示。然后,通过代理在环境中互动的视觉例子详细解释了算法的工作原理,从Q-Table的初始化到代理根据与环境的经验进行决策,再到构建要遵循的策略。

第4章涉及用于开发增强学习解决方案的实用工具。讨论了一些主要的库和框架,可用于实现RL算法,如TensorFlow、Keras和OpenAI Gym。还讨论了一些用于进行RL实验的有用数据源。

第5章提出了使用Python开发自主出租车的AI的实际案例。讨论了环境的细节,并举例说明了代理在不使用AI的情况下的行动。作为对比,接下来简化地展示了如何实现一个RL算法。代码带有注释,并详细解释,说明在这类问题中使用RL的差异和优势。该系统可供进一步测试和实施。

第6章展示了增强学习如何影响各个知识领域的最新应用。介绍了RL在机器人技术、游戏、教育和量子力学等领域的应用实例。还讨论了RL应用在不同领域的主要优势和挑战,以及在这些领域未来使用RL的展望。

成为VIP会员查看完整内容
110

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【2023新书】可解释强化学习,68页pdf
专知会员服务
78+阅读 · 2023年8月25日
【2023新书】分布式强化学习, 406页pdf
专知会员服务
178+阅读 · 2023年6月5日
【2023新书】数字孪生:动态系统与计算视角,252页pdf
专知会员服务
118+阅读 · 2023年4月2日
【Manning新书】面向数据编程降低软件复杂度,426页pdf
专知会员服务
85+阅读 · 2022年9月5日
【干货书】知识图谱:基础,技术与应用,568页pdf
专知会员服务
202+阅读 · 2022年8月18日
【2022新书】强化学习工业应用,408页pdf
专知会员服务
229+阅读 · 2022年2月3日
【新书】分布式强化学习,280页pdf
专知会员服务
155+阅读 · 2021年12月19日
【新书】基于物理的深度学习,220页pdf
专知会员服务
158+阅读 · 2021年9月15日
【2021新书】深度学习计算机视觉,320页pdf
专知会员服务
192+阅读 · 2021年5月20日
【2022新书】深度学习归一化技术,117页pdf
专知
24+阅读 · 2022年11月25日
【简明书】强化学习的基础,111页pdf
专知
1+阅读 · 2022年11月16日
【干货书】大规模图分析,632页pdf
专知
7+阅读 · 2022年10月8日
【新书】分布式强化学习,280页pdf
专知
21+阅读 · 2021年12月19日
国家自然科学基金
14+阅读 · 2017年12月31日
国家自然科学基金
6+阅读 · 2017年6月30日
国家自然科学基金
14+阅读 · 2016年12月31日
国家自然科学基金
27+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年4月30日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
Arxiv
163+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
425+阅读 · 2023年3月31日
Arxiv
69+阅读 · 2023年3月26日
Arxiv
153+阅读 · 2023年3月24日
VIP会员
相关VIP内容
【2023新书】可解释强化学习,68页pdf
专知会员服务
78+阅读 · 2023年8月25日
【2023新书】分布式强化学习, 406页pdf
专知会员服务
178+阅读 · 2023年6月5日
【2023新书】数字孪生:动态系统与计算视角,252页pdf
专知会员服务
118+阅读 · 2023年4月2日
【Manning新书】面向数据编程降低软件复杂度,426页pdf
专知会员服务
85+阅读 · 2022年9月5日
【干货书】知识图谱:基础,技术与应用,568页pdf
专知会员服务
202+阅读 · 2022年8月18日
【2022新书】强化学习工业应用,408页pdf
专知会员服务
229+阅读 · 2022年2月3日
【新书】分布式强化学习,280页pdf
专知会员服务
155+阅读 · 2021年12月19日
【新书】基于物理的深度学习,220页pdf
专知会员服务
158+阅读 · 2021年9月15日
【2021新书】深度学习计算机视觉,320页pdf
专知会员服务
192+阅读 · 2021年5月20日
相关基金
国家自然科学基金
14+阅读 · 2017年12月31日
国家自然科学基金
6+阅读 · 2017年6月30日
国家自然科学基金
14+阅读 · 2016年12月31日
国家自然科学基金
27+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年4月30日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员