【斯坦福经典书】强化学习在金融应用，414页pdf - 专知VIP

会员服务 ·

41

强化学习 · 金融 ·

2021 年 3 月 30 日

【斯坦福经典书】强化学习在金融应用，414页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

强化学习(RL)作为一种可行的、强大的技术，用于解决各种复杂的跨行业业务问题，包括在不确定性下的顺序优化决策。尽管RL被归类为机器学习(ML)的一个分支，但它的看待和处理方式往往与机器学习的其他分支(监督和非监督学习)非常不同。事实上，RL似乎掌握了开启人工智能前景的关键——人工智能可以根据观察到的信息的变化来调整决策，同时不断朝着最优结果前进。RL算法在无人驾驶汽车、机器人和策略游戏等备受瞩目的问题上的渗透，预示着未来RL算法的决策能力将远超人类。

本书重点研究支撑RL的基础理论。我们对这一理论的处理是基于本科水平的概率、优化、统计和线性代数。我们强调严谨但简单的数学符号和公式来发展理论，并鼓励你把方程写出来，而不是仅仅从书中阅读。偶尔，我们引用一些高等数学(如:随机微积分)，但本书的大部分是基于容易理解的数学。特别是，两个基本的理论概念- Bellman最优方程和广义策略迭代-贯穿全书，因为它们构成了我们在RL中所做的几乎所有事情的基础，甚至在最先进的算法中。

本书第二部分用动态规划或强化学习算法解决的金融应用。作为随机控制问题的许多金融应用的一个基本特征是，模型MDP的回报是效用函数，以捕捉金融回报和风险之间的权衡。

成为VIP会员查看完整内容

相关内容

强化学习

强化学习（RL）是机器学习的一个领域，与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外，强化学习是三种基本的机器学习范式之一。强化学习与监督学习的不同之处在于，不需要呈现带标签的输入/输出对，也不需要显式纠正次优动作。相反，重点是在探索（未知领域）和利用（当前知识）之间找到平衡。该环境通常以马尔可夫决策过程（MDP）的形式陈述，因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于，后者不假设MDP的确切数学模型，并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【经典书】机器学习导论，234页pdf

【经典书】机器学习导论，234页pdf

专知会员服务

77+阅读 · 2021年4月20日

【斯坦福经典书】机器学习导论，188页pdf

【斯坦福经典书】机器学习导论，188页pdf

专知会员服务

79+阅读 · 2021年3月31日

【斯坦福经典书】熵与信息论，311页pdf

专知会员服务

116+阅读 · 2021年3月23日

【经典书】信息论原理，774页pdf

【经典书】信息论原理，774页pdf

专知会员服务

262+阅读 · 2021年3月22日

【干货书】Python机器学习及金融应用，384页pdf

【干货书】Python机器学习及金融应用，384页pdf

专知会员服务

135+阅读 · 2021年1月1日

最新《计算控制理论》笔记与课程，60页pdf

专知会员服务

54+阅读 · 2020年12月24日

【斯坦福干货书】强化学习基金融领域应用，312页pdf

【斯坦福干货书】强化学习基金融领域应用，312页pdf

专知会员服务

134+阅读 · 2020年12月22日

【斯坦福经典书】概率理论，400页pdf

专知会员服务

143+阅读 · 2020年12月3日

《强化学习》简介小册，24页pdf

《强化学习》简介小册，24页pdf

专知会员服务

277+阅读 · 2020年4月19日

【斯坦福新课】CS234：强化学习，附课程PPT下载

【斯坦福新课】CS234：强化学习，附课程PPT下载

专知会员服务

124+阅读 · 2020年1月15日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

经典书《斯坦福大学-多智能体系统》532页pdf

经典书《斯坦福大学-多智能体系统》532页pdf

专知

119+阅读 · 2020年1月29日

经典书《机器学习：概率视角》第二版Python代码，附1098页pdf下载

经典书《机器学习：概率视角》第二版Python代码，附1098页pdf下载

专知

182+阅读 · 2019年10月23日

强化学习精品书籍

强化学习精品书籍

平均机器

26+阅读 · 2019年1月2日

【强化学习】强化学习的应用场景、基本概念、数学模型和交易中的应用

【强化学习】强化学习的应用场景、基本概念、数学模型和交易中的应用

产业智能官

18+阅读 · 2019年1月1日

强化学习——蒙特卡洛方法介绍

强化学习——蒙特卡洛方法介绍

论智

12+阅读 · 2018年6月3日

强化学习的入门之旅

强化学习的入门之旅

机器学习研究会

7+阅读 · 2018年2月12日

关于强化学习（附代码，练习和解答）

关于强化学习（附代码，练习和解答）

深度学习

37+阅读 · 2018年1月30日

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

产业智能官

41+阅读 · 2017年8月11日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

Compositional Processing Emerges in Neural Networks Solving Math Problems

Arxiv

0+阅读 · 2021年5月19日

Theoretical Analysis of Self-Training with Deep Networks on Unlabeled Data

Arxiv

9+阅读 · 2021年2月8日

CURL: Contrastive Unsupervised Representations for Reinforcement Learning

Arxiv

17+阅读 · 2020年4月28日

What Can Neural Networks Reason About?

Arxiv

10+阅读 · 2020年2月15日

Reinforcement Learning Enhanced Quantum-inspired Algorithm for Combinatorial Optimization

Arxiv

4+阅读 · 2020年2月14日

Optimization for deep learning: theory and algorithms

Optimization for deep learning: theory and algorithms

Arxiv

106+阅读 · 2019年12月19日

Improving Textual Network Embedding with Global Attention via Optimal Transport

Improving Textual Network Embedding with Global Attention via Optimal Transport

Arxiv

3+阅读 · 2019年6月5日

FickleNet: Weakly and Semi-supervised Semantic Image Segmentation\\using Stochastic Inference

Arxiv

5+阅读 · 2019年2月27日

Graph Neural Networks: A Review of Methods and Applications

Graph Neural Networks: A Review of Methods and Applications

Arxiv

75+阅读 · 2018年12月20日

Learning Representative Temporal Features for Action Recognition

Arxiv

4+阅读 · 2018年3月14日

VIP会员

相关主题

相关VIP内容

【经典书】机器学习导论，234页pdf

【经典书】机器学习导论，234页pdf

专知会员服务

77+阅读 · 2021年4月20日

【斯坦福经典书】机器学习导论，188页pdf

【斯坦福经典书】机器学习导论，188页pdf

专知会员服务

79+阅读 · 2021年3月31日

【斯坦福经典书】熵与信息论，311页pdf

专知会员服务

116+阅读 · 2021年3月23日

【经典书】信息论原理，774页pdf

【经典书】信息论原理，774页pdf

专知会员服务

262+阅读 · 2021年3月22日

【干货书】Python机器学习及金融应用，384页pdf

【干货书】Python机器学习及金融应用，384页pdf

专知会员服务

135+阅读 · 2021年1月1日

最新《计算控制理论》笔记与课程，60页pdf

专知会员服务

54+阅读 · 2020年12月24日

【斯坦福干货书】强化学习基金融领域应用，312页pdf

【斯坦福干货书】强化学习基金融领域应用，312页pdf

专知会员服务

134+阅读 · 2020年12月22日

【斯坦福经典书】概率理论，400页pdf

专知会员服务

143+阅读 · 2020年12月3日

《强化学习》简介小册，24页pdf

《强化学习》简介小册，24页pdf

专知会员服务

277+阅读 · 2020年4月19日

【斯坦福新课】CS234：强化学习，附课程PPT下载

【斯坦福新课】CS234：强化学习，附课程PPT下载

专知会员服务

124+阅读 · 2020年1月15日

热门VIP内容

开通专知VIP会员享更多权益服务

扩散语言模型综述

《美陆军徒步机动作战条令手册》最新168页

【博士论文】理解神经网络的训练动态：从局部优化轨迹与特征学习视角

军事后勤数字化未来展望

相关资讯

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

经典书《斯坦福大学-多智能体系统》532页pdf

经典书《斯坦福大学-多智能体系统》532页pdf

专知

119+阅读 · 2020年1月29日

经典书《机器学习：概率视角》第二版Python代码，附1098页pdf下载

经典书《机器学习：概率视角》第二版Python代码，附1098页pdf下载

专知

182+阅读 · 2019年10月23日

强化学习精品书籍

强化学习精品书籍

平均机器

26+阅读 · 2019年1月2日

【强化学习】强化学习的应用场景、基本概念、数学模型和交易中的应用

【强化学习】强化学习的应用场景、基本概念、数学模型和交易中的应用

产业智能官

18+阅读 · 2019年1月1日

强化学习——蒙特卡洛方法介绍

强化学习——蒙特卡洛方法介绍

论智

12+阅读 · 2018年6月3日

强化学习的入门之旅

强化学习的入门之旅

机器学习研究会

7+阅读 · 2018年2月12日

关于强化学习（附代码，练习和解答）

关于强化学习（附代码，练习和解答）

深度学习

37+阅读 · 2018年1月30日

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

产业智能官

41+阅读 · 2017年8月11日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

相关论文

Compositional Processing Emerges in Neural Networks Solving Math Problems

Arxiv

0+阅读 · 2021年5月19日

Theoretical Analysis of Self-Training with Deep Networks on Unlabeled Data

Arxiv

9+阅读 · 2021年2月8日

CURL: Contrastive Unsupervised Representations for Reinforcement Learning

Arxiv

17+阅读 · 2020年4月28日

What Can Neural Networks Reason About?

Arxiv

10+阅读 · 2020年2月15日

Reinforcement Learning Enhanced Quantum-inspired Algorithm for Combinatorial Optimization

Arxiv

4+阅读 · 2020年2月14日

Optimization for deep learning: theory and algorithms

Optimization for deep learning: theory and algorithms

Arxiv

106+阅读 · 2019年12月19日

Improving Textual Network Embedding with Global Attention via Optimal Transport

Improving Textual Network Embedding with Global Attention via Optimal Transport

Arxiv

3+阅读 · 2019年6月5日

FickleNet: Weakly and Semi-supervised Semantic Image Segmentation\\using Stochastic Inference

Arxiv

5+阅读 · 2019年2月27日

Graph Neural Networks: A Review of Methods and Applications

Graph Neural Networks: A Review of Methods and Applications

Arxiv

75+阅读 · 2018年12月20日

Learning Representative Temporal Features for Action Recognition

Arxiv

4+阅读 · 2018年3月14日

微信扫码咨询专知VIP会员