强化学习(RL)作为一种可行的、强大的技术,用于解决各种复杂的跨行业业务问题,包括在不确定性下的顺序优化决策。尽管RL被归类为机器学习(ML)的一个分支,但它的看待和处理方式往往与机器学习的其他分支(监督和非监督学习)非常不同。事实上,RL似乎掌握了开启人工智能前景的关键——人工智能可以根据观察到的信息的变化来调整决策,同时不断朝着最优结果前进。RL算法在无人驾驶汽车、机器人和策略游戏等备受瞩目的问题上的渗透,预示着未来RL算法的决策能力将远超人类。

本书重点研究支撑RL的基础理论。我们对这一理论的处理是基于本科水平的概率、优化、统计和线性代数。我们强调严谨但简单的数学符号和公式来发展理论,并鼓励你把方程写出来,而不是仅仅从书中阅读。偶尔,我们引用一些高等数学(如:随机微积分),但本书的大部分是基于容易理解的数学。特别是,两个基本的理论概念- Bellman最优方程和广义策略迭代-贯穿全书,因为它们构成了我们在RL中所做的几乎所有事情的基础,甚至在最先进的算法中。

本书第二部分用动态规划或强化学习算法解决的金融应用。作为随机控制问题的许多金融应用的一个基本特征是,模型MDP的回报是效用函数,以捕捉金融回报和风险之间的权衡。

成为VIP会员查看完整内容
123

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【经典书】机器学习导论,234页pdf
专知会员服务
76+阅读 · 2021年4月20日
【斯坦福经典书】机器学习导论,188页pdf
专知会员服务
78+阅读 · 2021年3月31日
专知会员服务
114+阅读 · 2021年3月23日
【经典书】信息论原理,774页pdf
专知会员服务
257+阅读 · 2021年3月22日
【干货书】Python机器学习及金融应用,384页pdf
专知会员服务
135+阅读 · 2021年1月1日
专知会员服务
53+阅读 · 2020年12月24日
【斯坦福干货书】强化学习基金融领域应用,312页pdf
专知会员服务
133+阅读 · 2020年12月22日
专知会员服务
141+阅读 · 2020年12月3日
《强化学习》简介小册,24页pdf
专知会员服务
274+阅读 · 2020年4月19日
【斯坦福新课】CS234:强化学习,附课程PPT下载
专知会员服务
121+阅读 · 2020年1月15日
经典书《斯坦福大学-多智能体系统》532页pdf
强化学习精品书籍
平均机器
25+阅读 · 2019年1月2日
强化学习——蒙特卡洛方法介绍
论智
12+阅读 · 2018年6月3日
强化学习的入门之旅
机器学习研究会
7+阅读 · 2018年2月12日
关于强化学习(附代码,练习和解答)
深度学习
37+阅读 · 2018年1月30日
【强化学习】强化学习+深度学习=人工智能
产业智能官
54+阅读 · 2017年8月11日
Arxiv
9+阅读 · 2020年2月15日
Optimization for deep learning: theory and algorithms
Arxiv
105+阅读 · 2019年12月19日
VIP会员
相关VIP内容
【经典书】机器学习导论,234页pdf
专知会员服务
76+阅读 · 2021年4月20日
【斯坦福经典书】机器学习导论,188页pdf
专知会员服务
78+阅读 · 2021年3月31日
专知会员服务
114+阅读 · 2021年3月23日
【经典书】信息论原理,774页pdf
专知会员服务
257+阅读 · 2021年3月22日
【干货书】Python机器学习及金融应用,384页pdf
专知会员服务
135+阅读 · 2021年1月1日
专知会员服务
53+阅读 · 2020年12月24日
【斯坦福干货书】强化学习基金融领域应用,312页pdf
专知会员服务
133+阅读 · 2020年12月22日
专知会员服务
141+阅读 · 2020年12月3日
《强化学习》简介小册,24页pdf
专知会员服务
274+阅读 · 2020年4月19日
【斯坦福新课】CS234:强化学习,附课程PPT下载
专知会员服务
121+阅读 · 2020年1月15日
相关资讯
经典书《斯坦福大学-多智能体系统》532页pdf
强化学习精品书籍
平均机器
25+阅读 · 2019年1月2日
强化学习——蒙特卡洛方法介绍
论智
12+阅读 · 2018年6月3日
强化学习的入门之旅
机器学习研究会
7+阅读 · 2018年2月12日
关于强化学习(附代码,练习和解答)
深度学习
37+阅读 · 2018年1月30日
【强化学习】强化学习+深度学习=人工智能
产业智能官
54+阅读 · 2017年8月11日
微信扫码咨询专知VIP会员