许多重要的问题都涉及不确定性下的决策,包括飞机碰撞避免、灾害管理和灾难反应。在设计自动化决策系统或决策支持系统时,在做出或推荐决策时考虑各种不确定性来源是很重要的。考虑到这些不确定性的来源并仔细平衡系统的多个目标是非常具有挑战性的。我们将从计算的角度讨论这些挑战,旨在提供决策模型和计算方法背后的理论。本章介绍了不确定性下的决策问题,提供了一些应用实例,并概述了可能的计算方法的空间。本章总结了各种学科对我们理解智能决策的贡献,并强调了潜在社会影响的领域。我们以本书其余部分的大纲结束。
https://github.com/sisl/algorithmsbook
Introduction
Representation
Inference
Parameter Learning
Structure Learning
Simple Decisions
Exact Solution Methods
Approximate Value Functions
Online Planning
Policy Search
Policy Gradient Estimation
Policy Gradient Optimization
Actor-Critic Methods
Policy Validation
Exploration and Exploitation
Model-Based Methods
Model-Free Methods
Imitation Learning
Beliefs
Exact Belief State Planning
Offline Belief State Planning
Online Belief State Planning
Controller Abstractions
Multiagent Reasoning
Sequential Problems
State Uncertainty
Collaborative Agents
A: Mathematical Concepts
B: Probability Distributions
C: Computational Complexity
D: Neural Representations
E: Search Algorithms
F: Problems
G: Julia
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“DMA” 就可以获取《【斯坦福新书】决策算法,464页pdf,Algorithms for Decision Making》专知下载链接