【斯坦福新书】决策算法，464页pdf，Algorithms for Decision Making - 专知

会员服务 ·

0

【斯坦福新书】决策算法，464页pdf，Algorithms for Decision Making

2020 年 12 月 7 日 专知

许多重要的问题都涉及不确定性下的决策，包括飞机碰撞避免、灾害管理和灾难反应。在设计自动化决策系统或决策支持系统时，在做出或推荐决策时考虑各种不确定性来源是很重要的。考虑到这些不确定性的来源并仔细平衡系统的多个目标是非常具有挑战性的。我们将从计算的角度讨论这些挑战，旨在提供决策模型和计算方法背后的理论。本章介绍了不确定性下的决策问题，提供了一些应用实例，并概述了可能的计算方法的空间。本章总结了各种学科对我们理解智能决策的贡献，并强调了潜在社会影响的领域。我们以本书其余部分的大纲结束。

https://github.com/sisl/algorithmsbook

Outline

Introduction

Part I: Probabilistic Reasoning

Representation
Inference
Parameter Learning
Structure Learning
Simple Decisions

Part II: Sequential Problems

Exact Solution Methods
Approximate Value Functions
Online Planning
Policy Search
Policy Gradient Estimation
Policy Gradient Optimization
Actor-Critic Methods
Policy Validation

Part III: Model Uncertainty

Exploration and Exploitation
Model-Based Methods
Model-Free Methods
Imitation Learning

Part IV: State Uncertainty

Beliefs
Exact Belief State Planning
Offline Belief State Planning
Online Belief State Planning
Controller Abstractions

Part V: Multiagent Systems

Multiagent Reasoning
Sequential Problems
State Uncertainty
Collaborative Agents

Appendices

A: Mathematical Concepts
B: Probability Distributions
C: Computational Complexity
D: Neural Representations
E: Search Algorithms
F: Problems
G: Julia

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“DMA” 就可以获取《【斯坦福新书】决策算法，464页pdf，Algorithms for Decision Making》专知下载链接

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

0

相关内容

决策算法

【斯坦福2021新书】决策算法，694页pdf阐述不确定性决策

【斯坦福2021新书】决策算法，694页pdf阐述不确定性决策

专知会员服务

264+阅读 · 2021年1月27日

【干货书】机器学习速查手册，135页pdf

【干货书】机器学习速查手册，135页pdf

专知会员服务

127+阅读 · 2020年11月20日

【2020新书】概率机器学习，附212页pdf与slides

【2020新书】概率机器学习，附212页pdf与slides

专知会员服务

112+阅读 · 2020年11月12日

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知会员服务

280+阅读 · 2020年7月2日

【Manning新书】现代Java实战，592页pdf

【Manning新书】现代Java实战，592页pdf

专知会员服务

101+阅读 · 2020年5月22日

【经典书】贝叶斯编程，378页pdf，Bayesian Programming

【经典书】贝叶斯编程，378页pdf，Bayesian Programming

专知会员服务

251+阅读 · 2020年5月18日

经典书《斯坦福大学-多智能体系统》532页pdf，MULTIAGENT SYSTEMS Algorithmic, Game-Theoretic, and Logical Foundations

经典书《斯坦福大学-多智能体系统》532页pdf，MULTIAGENT SYSTEMS Algorithmic, Game-Theoretic, and Logical Foundations

专知会员服务

158+阅读 · 2020年1月29日

【新书】深度学习搜索，Deep Learning for Search，附327页pdf

【新书】深度学习搜索，Deep Learning for Search，附327页pdf

专知会员服务

214+阅读 · 2020年1月13日

【微软Alekh等开放新书】强化学习理论与算法（Reinforcement Learning:Theory and Algorithms），附83页pdf

【微软Alekh等开放新书】强化学习理论与算法（Reinforcement Learning:Theory and Algorithms），附83页pdf

专知会员服务

122+阅读 · 2019年11月24日

MIT新书《强化学习与最优控制》

MIT新书《强化学习与最优控制》

专知会员服务

281+阅读 · 2019年10月9日

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知

58+阅读 · 2020年7月2日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

【UCSD-MIT】深度学习隐私综述论文，Privacy in Deep Learning: A Survey

【UCSD-MIT】深度学习隐私综述论文，Privacy in Deep Learning: A Survey

专知

5+阅读 · 2020年4月28日

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

专知

43+阅读 · 2020年3月10日

深度学习金融应用综述论文，52页pdf，Deep Learning for Financial Applications

深度学习金融应用综述论文，52页pdf，Deep Learning for Financial Applications

专知

7+阅读 · 2020年2月18日

康奈尔大学Jon Kleinberg经典书《算法设计Algorithm Design》课件PPT与电子书，864页pdf

康奈尔大学Jon Kleinberg经典书《算法设计Algorithm Design》课件PPT与电子书，864页pdf

专知

47+阅读 · 2020年1月21日

【新书】深度学习搜索，Deep Learning for Search，327页pdf

【新书】深度学习搜索，Deep Learning for Search，327页pdf

专知

85+阅读 · 2020年1月19日

2019年新书-Marc Peter Deisenroth《机器学习基础》-免费分享

2019年新书-Marc Peter Deisenroth《机器学习基础》-免费分享

深度学习与NLP

18+阅读 · 2019年9月17日

普林斯顿大学19年春季学期《机器学习优化》课程讲义

普林斯顿大学19年春季学期《机器学习优化》课程讲义

专知

12+阅读 · 2019年6月13日

自动驾驶最新综述论文（31页PDF下载）

自动驾驶最新综述论文（31页PDF下载）

专知

119+阅读 · 2019年1月15日

Towards a theory of machine learning

Towards a theory of machine learning

Arxiv

0+阅读 · 2021年2月12日

A Dynamical Systems Approach for Convergence of the Bayesian EM Algorithm

Arxiv

0+阅读 · 2021年2月12日

RobOT: Robustness-Oriented Testing for Deep Learning Systems

Arxiv

0+阅读 · 2021年2月11日

Deep Reinforcement Learning for Combinatorial Optimization: Covering Salesman Problems

Arxiv

0+阅读 · 2021年2月11日

Common Information Belief based Dynamic Programs for Stochastic Zero-sum Games with Competing Teams

Arxiv

0+阅读 · 2021年2月11日

Causal Inference for Time series Analysis: Problems, Methods and Evaluation

Arxiv

1+阅读 · 2021年2月11日

Runtime Analysis of RLS and the (1+1) EA for the Chance-constrained Knapsack Problem with Correlated Uniform Weights

Arxiv

0+阅读 · 2021年2月10日

Optimization for deep learning: theory and algorithms

Optimization for deep learning: theory and algorithms

Arxiv

106+阅读 · 2019年12月19日

Learning to Walk via Deep Reinforcement Learning

Arxiv

7+阅读 · 2018年12月26日

Distributed Constraint Optimization Problems and Applications: A Survey

Arxiv

5+阅读 · 2018年1月11日

VIP会员

相关主题

相关VIP内容

【斯坦福2021新书】决策算法，694页pdf阐述不确定性决策

【斯坦福2021新书】决策算法，694页pdf阐述不确定性决策

专知会员服务

264+阅读 · 2021年1月27日

【干货书】机器学习速查手册，135页pdf

【干货书】机器学习速查手册，135页pdf

专知会员服务

127+阅读 · 2020年11月20日

【2020新书】概率机器学习，附212页pdf与slides

【2020新书】概率机器学习，附212页pdf与slides

专知会员服务

112+阅读 · 2020年11月12日

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知会员服务

280+阅读 · 2020年7月2日

【Manning新书】现代Java实战，592页pdf

【Manning新书】现代Java实战，592页pdf

专知会员服务

101+阅读 · 2020年5月22日

【经典书】贝叶斯编程，378页pdf，Bayesian Programming

【经典书】贝叶斯编程，378页pdf，Bayesian Programming

专知会员服务

251+阅读 · 2020年5月18日

经典书《斯坦福大学-多智能体系统》532页pdf，MULTIAGENT SYSTEMS Algorithmic, Game-Theoretic, and Logical Foundations

经典书《斯坦福大学-多智能体系统》532页pdf，MULTIAGENT SYSTEMS Algorithmic, Game-Theoretic, and Logical Foundations

专知会员服务

158+阅读 · 2020年1月29日

【新书】深度学习搜索，Deep Learning for Search，附327页pdf

【新书】深度学习搜索，Deep Learning for Search，附327页pdf

专知会员服务

214+阅读 · 2020年1月13日

【微软Alekh等开放新书】强化学习理论与算法（Reinforcement Learning:Theory and Algorithms），附83页pdf

【微软Alekh等开放新书】强化学习理论与算法（Reinforcement Learning:Theory and Algorithms），附83页pdf

专知会员服务

122+阅读 · 2019年11月24日

MIT新书《强化学习与最优控制》

MIT新书《强化学习与最优控制》

专知会员服务

281+阅读 · 2019年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

Deep Research（深度研究）：系统性综述

《革新战术战场空间能力：反无人机系统》报告

【普林斯顿博士论文】用于语音的生成式通用模型

螺旋式开发作为战略资产：美军启示

相关资讯

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知

58+阅读 · 2020年7月2日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

【UCSD-MIT】深度学习隐私综述论文，Privacy in Deep Learning: A Survey

【UCSD-MIT】深度学习隐私综述论文，Privacy in Deep Learning: A Survey

专知

5+阅读 · 2020年4月28日

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

专知

43+阅读 · 2020年3月10日

深度学习金融应用综述论文，52页pdf，Deep Learning for Financial Applications

深度学习金融应用综述论文，52页pdf，Deep Learning for Financial Applications

专知

7+阅读 · 2020年2月18日

康奈尔大学Jon Kleinberg经典书《算法设计Algorithm Design》课件PPT与电子书，864页pdf

康奈尔大学Jon Kleinberg经典书《算法设计Algorithm Design》课件PPT与电子书，864页pdf

专知

47+阅读 · 2020年1月21日

【新书】深度学习搜索，Deep Learning for Search，327页pdf

【新书】深度学习搜索，Deep Learning for Search，327页pdf

专知

85+阅读 · 2020年1月19日

2019年新书-Marc Peter Deisenroth《机器学习基础》-免费分享

2019年新书-Marc Peter Deisenroth《机器学习基础》-免费分享

深度学习与NLP

18+阅读 · 2019年9月17日

普林斯顿大学19年春季学期《机器学习优化》课程讲义

普林斯顿大学19年春季学期《机器学习优化》课程讲义

专知

12+阅读 · 2019年6月13日

自动驾驶最新综述论文（31页PDF下载）

自动驾驶最新综述论文（31页PDF下载）

专知

119+阅读 · 2019年1月15日

相关论文

Towards a theory of machine learning

Towards a theory of machine learning

Arxiv

0+阅读 · 2021年2月12日

A Dynamical Systems Approach for Convergence of the Bayesian EM Algorithm

Arxiv

0+阅读 · 2021年2月12日

RobOT: Robustness-Oriented Testing for Deep Learning Systems

Arxiv

0+阅读 · 2021年2月11日

Deep Reinforcement Learning for Combinatorial Optimization: Covering Salesman Problems

Arxiv

0+阅读 · 2021年2月11日

Common Information Belief based Dynamic Programs for Stochastic Zero-sum Games with Competing Teams

Arxiv

0+阅读 · 2021年2月11日

Causal Inference for Time series Analysis: Problems, Methods and Evaluation

Arxiv

1+阅读 · 2021年2月11日

Runtime Analysis of RLS and the (1+1) EA for the Chance-constrained Knapsack Problem with Correlated Uniform Weights

Arxiv

0+阅读 · 2021年2月10日

Optimization for deep learning: theory and algorithms

Optimization for deep learning: theory and algorithms

Arxiv

106+阅读 · 2019年12月19日

Learning to Walk via Deep Reinforcement Learning

Arxiv

7+阅读 · 2018年12月26日

Distributed Constraint Optimization Problems and Applications: A Survey

Arxiv

5+阅读 · 2018年1月11日

大家都在搜

大型语言模型

生成式人工智能

无人机系统

蓝牙安全攻防

精排模型-从MLP到行为序列：DIN、DIEN、MIMN、SIM、DSIN

微信扫码咨询专知VIP会员