【斯坦福2021新书】决策算法,694页pdf阐述不确定性决策算法

2021 年 1 月 27 日 专知

hms for solving them.

这本书提供了一个广泛的不确定性决策的算法介绍。我们涵盖了与决策相关的各种主题,介绍了潜在的数学问题公式和解决它们的算法。

本文面向高级本科生、研究生和专业人员。本书要求具有一定的数学基础,并假定预先接触过多变量微积分、线性代数和概率概念。附录中提供了一些复习材料。这本书特别有用的学科包括数学、统计学、计算机科学、航空航天、电气工程和运筹学。


这本教科书的基础是算法,它们都是用Julia编程语言实现的。这本允许免费使用与本书相关的代码片段,条件是必须确认代码的来源。我们预计其他人可能想把这些算法翻译成其他编程语言。随着翻译版本的发布,我们将从该书的网页上链接到它们。


许多重要的问题都涉及不确定性下的决策,包括飞机碰撞避免、灾害管理和灾难反应。在设计自动化决策系统或决策支持系统时,在做出或推荐决策时考虑各种不确定性来源是很重要的。考虑到这些不确定性的来源并仔细平衡系统的多个目标是非常具有挑战性的。我们将从计算的角度讨论这些挑战,旨在提供决策模型和计算方法背后的理论。本章介绍了不确定性下的决策问题,提供了一些应用实例,并概述了可能的计算方法的空间。本章总结了各种学科对我们理解智能决策的贡献,并强调了潜在社会影响的领域。我们以本书其余部分的大纲结束。


https://algorithmsbook.com/


  1. Introduction

PART I: PROBABILISTIC REASONING

  1. Representation

  2. Inference

  3. Parameter Learning

  4. Structure Learning

  5. Simple Decisions

PART II: SEQUENTIAL PROBLEMS

  1. Exact Solution Methods

  2. Approximate Value Functions

  3. Online Planning

  4. Policy Search

  5. Policy Gradient Estimation

  6. Policy Gradient Optimization

  7. Actor-Critic Methods

  8. Policy Validation

PART III: MODEL UNCERTAINTY

  1. Exploration and Exploitation

  2. Model-Based Methods

  3. Model-Free Methods

  4. Imitation Learning

PART IV: STATE UNCERTAINTY

  1. Beliefs

  2. Exact Belief State Planning

  3. Offline Belief State Planning

  4. Online Belief State Planning

  5. Controller Abstractions

PART V: MULTIAGENT SYSTEMS

  1. Multiagent Reasoning

  2. Sequential Problems

  3. State Uncertainty

  4. Collaborative Agents

APPENDICES

  1. A: Mathematical Concepts

  2. B: Probability Distributions

  3. C: Computational Complexity

  4. D: Neural Representations

  5. E: Search Algorithms

  6. F: Problems

  7. G: Julia

专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“A694” 可以获取【斯坦福2021新书】决策算法,694页pdf阐述不确定性决策算法专知下载链接索引

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
0

相关内容

【斯坦福经典书】强化学习在金融应用,414页pdf
专知会员服务
123+阅读 · 2021年3月30日
【斯坦福2021新书】决策算法,694页pdf阐述不确定性决策
专知会员服务
258+阅读 · 2021年1月27日
专知会员服务
79+阅读 · 2020年12月22日
【斯坦福干货书】强化学习基金融领域应用,312页pdf
专知会员服务
133+阅读 · 2020年12月22日
【干货书】机器学习速查手册,135页pdf
专知会员服务
126+阅读 · 2020年11月20日
【2020新书】概率机器学习,附212页pdf与slides
专知会员服务
111+阅读 · 2020年11月12日
经典书《斯坦福大学-多智能体系统》532页pdf
《AutoML:方法,系统,挑战》新书免费下载
新智元
24+阅读 · 2019年5月28日
421页《机器学习数学基础》最新2019版PDF下载
Arxiv
6+阅读 · 2020年12月8日
Meta-Learning with Implicit Gradients
Arxiv
13+阅读 · 2019年9月10日
Generalization and Regularization in DQN
Arxiv
6+阅读 · 2019年1月30日
Arxiv
5+阅读 · 2018年6月12日
Arxiv
5+阅读 · 2017年12月14日
VIP会员
相关VIP内容
【斯坦福经典书】强化学习在金融应用,414页pdf
专知会员服务
123+阅读 · 2021年3月30日
【斯坦福2021新书】决策算法,694页pdf阐述不确定性决策
专知会员服务
258+阅读 · 2021年1月27日
专知会员服务
79+阅读 · 2020年12月22日
【斯坦福干货书】强化学习基金融领域应用,312页pdf
专知会员服务
133+阅读 · 2020年12月22日
【干货书】机器学习速查手册,135页pdf
专知会员服务
126+阅读 · 2020年11月20日
【2020新书】概率机器学习,附212页pdf与slides
专知会员服务
111+阅读 · 2020年11月12日
Top
微信扫码咨询专知VIP会员