【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学 - 专知VIP

会员服务 ·

73

不确定性决策 · 强化学习 ·

2020 年 4 月 28 日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

决策理论是现代人工智能和经济学的基础。本课程主要从统计学的角度，也从哲学的角度，为决策理论打下坚实的基础。本课程有两个目的:

深入了解统计决策理论、实验设计的自动化方法，并将其与人类决策联系起来。
通过开发算法和智能代理的实验，将该理论应用到强化学习和人工智能的实际问题中。

课程可分为两部分。

第一部分，我们介绍了主观概率和效用的概念，以及如何用它们来表示和解决决策问题。然后讨论未知参数的估计和假设检验。最后，我们讨论了顺序抽样、顺序实验，以及更一般的顺序决策。
第二部分是不确定性下的决策研究，特别是强化学习和专家咨询学习。首先，我们研究几个有代表性的统计模型。然后，我们给出了使用这些模型做出最优决策的算法的概述。最后，我们来看看学习如何根据专家的建议来行动的问题，这个领域最近在在线广告、游戏树搜索和优化方面有很多应用。

成为VIP会员查看完整内容

相关内容

不确定性决策

不确定性决策

【开放书-纽约大学】面向数据科学的概率与统计，237页pdf

【开放书-纽约大学】面向数据科学的概率与统计，237页pdf

专知会员服务

149+阅读 · 2020年7月6日

波士顿大学Francesco《在线学习导论》2020书册，126页pdf详述在线学习最新进展

波士顿大学Francesco《在线学习导论》2020书册，126页pdf详述在线学习最新进展

专知会员服务

60+阅读 · 2020年5月13日

最新《智能交通系统的深度强化学习》综述论文，22页pdf

最新《智能交通系统的深度强化学习》综述论文，22页pdf

专知会员服务

188+阅读 · 2020年5月5日

【硬核书】博弈论导论，417页pdf，Game Theory: An Introduction，普林斯顿大学出版社

【硬核书】博弈论导论，417页pdf，Game Theory: An Introduction，普林斯顿大学出版社

专知会员服务

230+阅读 · 2020年4月21日

《强化学习》简介小册，24页pdf

《强化学习》简介小册，24页pdf

专知会员服务

277+阅读 · 2020年4月19日

2020年MIT出版社新书《因果推理原理：基础与学习算法》，289页pdf

2020年MIT出版社新书《因果推理原理：基础与学习算法》，289页pdf

专知会员服务

474+阅读 · 2020年2月17日

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

专知会员服务

184+阅读 · 2020年1月17日

【开放书】部分观测动态系统的贝叶斯学习，119页pdf，Bayesian Learning for partially observed dynamical systems

【开放书】部分观测动态系统的贝叶斯学习，119页pdf，Bayesian Learning for partially observed dynamical systems

专知会员服务

41+阅读 · 2019年12月27日

人工智能学习笔记，247页pdf

人工智能学习笔记，247页pdf

专知会员服务

186+阅读 · 2019年12月14日

【微软Alekh等开放新书】强化学习理论与算法（Reinforcement Learning:Theory and Algorithms），附83页pdf

【微软Alekh等开放新书】强化学习理论与算法（Reinforcement Learning:Theory and Algorithms），附83页pdf

专知会员服务

121+阅读 · 2019年11月24日

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

专知

25+阅读 · 2019年11月23日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

【图灵奖得主Judea Pearl推荐新书】图模型(Graphical Models), 571页pdf，带你学习GM和因果推断

【图灵奖得主Judea Pearl推荐新书】图模型(Graphical Models), 571页pdf，带你学习GM和因果推断

专知

67+阅读 · 2019年9月26日

最新版《机器学习数学基础》发布，417页PDF免费下载

最新版《机器学习数学基础》发布，417页PDF免费下载

新智元

60+阅读 · 2019年9月5日

《AutoML：方法，系统，挑战》新书免费下载

《AutoML：方法，系统，挑战》新书免费下载

新智元

24+阅读 · 2019年5月28日

421页《机器学习数学基础》最新2019版PDF下载

421页《机器学习数学基础》最新2019版PDF下载

专知

177+阅读 · 2019年3月17日

强化学习精品书籍

强化学习精品书籍

平均机器

26+阅读 · 2019年1月2日

自然语言处理最新教材开放下载，乔治亚理工大学官方推荐

自然语言处理最新教材开放下载，乔治亚理工大学官方推荐

机器之心

13+阅读 · 2018年6月3日

论强化学习和概率推断的等价性：一种全新概率模型

论强化学习和概率推断的等价性：一种全新概率模型

机器之心

25+阅读 · 2018年5月5日

一文学习基于蒙特卡罗的强化学习方法（送书）

一文学习基于蒙特卡罗的强化学习方法（送书）

人工智能头条

7+阅读 · 2018年3月13日

Advances and Open Problems in Federated Learning

Advances and Open Problems in Federated Learning

Arxiv

18+阅读 · 2019年12月10日

Object-centric Forward Modeling for Model Predictive Control

Object-centric Forward Modeling for Model Predictive Control

Arxiv

5+阅读 · 2019年10月8日

Reward learning from human preferences and demonstrations in Atari

Arxiv

8+阅读 · 2018年11月15日

Sample Efficient Adaptive Text-to-Speech

Arxiv

7+阅读 · 2018年9月27日

Large Margin Few-Shot Learning

Arxiv

11+阅读 · 2018年7月8日

Reproducibility Report for "Learning To Count Objects In Natural Images For Visual Question Answering"

Reproducibility Report for "Learning To Count Objects In Natural Images For Visual Question Answering"

Arxiv

4+阅读 · 2018年5月21日

Learning Human Pose Models from Synthesized Data for Robust RGB-D Action Recognition

Arxiv

3+阅读 · 2018年5月1日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

Learning to Evade Static PE Machine Learning Malware Models via Reinforcement Learning

Arxiv

3+阅读 · 2018年1月30日

A Generative Model For Zero Shot Learning Using Conditional Variational Autoencoders

Arxiv

9+阅读 · 2018年1月27日

VIP会员

相关主题

不确定性决策

相关VIP内容

【开放书-纽约大学】面向数据科学的概率与统计，237页pdf

【开放书-纽约大学】面向数据科学的概率与统计，237页pdf

专知会员服务

149+阅读 · 2020年7月6日

波士顿大学Francesco《在线学习导论》2020书册，126页pdf详述在线学习最新进展

波士顿大学Francesco《在线学习导论》2020书册，126页pdf详述在线学习最新进展

专知会员服务

60+阅读 · 2020年5月13日

最新《智能交通系统的深度强化学习》综述论文，22页pdf

最新《智能交通系统的深度强化学习》综述论文，22页pdf

专知会员服务

188+阅读 · 2020年5月5日

【硬核书】博弈论导论，417页pdf，Game Theory: An Introduction，普林斯顿大学出版社

【硬核书】博弈论导论，417页pdf，Game Theory: An Introduction，普林斯顿大学出版社

专知会员服务

230+阅读 · 2020年4月21日

《强化学习》简介小册，24页pdf

《强化学习》简介小册，24页pdf

专知会员服务

277+阅读 · 2020年4月19日

2020年MIT出版社新书《因果推理原理：基础与学习算法》，289页pdf

2020年MIT出版社新书《因果推理原理：基础与学习算法》，289页pdf

专知会员服务

474+阅读 · 2020年2月17日

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

专知会员服务

184+阅读 · 2020年1月17日

【开放书】部分观测动态系统的贝叶斯学习，119页pdf，Bayesian Learning for partially observed dynamical systems

【开放书】部分观测动态系统的贝叶斯学习，119页pdf，Bayesian Learning for partially observed dynamical systems

专知会员服务

41+阅读 · 2019年12月27日

人工智能学习笔记，247页pdf

人工智能学习笔记，247页pdf

专知会员服务

186+阅读 · 2019年12月14日

【微软Alekh等开放新书】强化学习理论与算法（Reinforcement Learning:Theory and Algorithms），附83页pdf

【微软Alekh等开放新书】强化学习理论与算法（Reinforcement Learning:Theory and Algorithms），附83页pdf

专知会员服务

121+阅读 · 2019年11月24日

热门VIP内容

开通专知VIP会员享更多权益服务

《自适应训练辅助系统概念导论及其在空战指挥官加速培训中的应用》125页

《美陆军近战整合企业现代化计划（2025—2026）》最新报告

以色列-伊朗空战：短暂而激烈冲突的启示

《动态作战支援演习框架构建》80页

相关资讯

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

专知

25+阅读 · 2019年11月23日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

【图灵奖得主Judea Pearl推荐新书】图模型(Graphical Models), 571页pdf，带你学习GM和因果推断

【图灵奖得主Judea Pearl推荐新书】图模型(Graphical Models), 571页pdf，带你学习GM和因果推断

专知

67+阅读 · 2019年9月26日

最新版《机器学习数学基础》发布，417页PDF免费下载

最新版《机器学习数学基础》发布，417页PDF免费下载

新智元

60+阅读 · 2019年9月5日

《AutoML：方法，系统，挑战》新书免费下载

《AutoML：方法，系统，挑战》新书免费下载

新智元

24+阅读 · 2019年5月28日

421页《机器学习数学基础》最新2019版PDF下载

421页《机器学习数学基础》最新2019版PDF下载

专知

177+阅读 · 2019年3月17日

强化学习精品书籍

强化学习精品书籍

平均机器

26+阅读 · 2019年1月2日

自然语言处理最新教材开放下载，乔治亚理工大学官方推荐

自然语言处理最新教材开放下载，乔治亚理工大学官方推荐

机器之心

13+阅读 · 2018年6月3日

论强化学习和概率推断的等价性：一种全新概率模型

论强化学习和概率推断的等价性：一种全新概率模型

机器之心

25+阅读 · 2018年5月5日

一文学习基于蒙特卡罗的强化学习方法（送书）

一文学习基于蒙特卡罗的强化学习方法（送书）

人工智能头条

7+阅读 · 2018年3月13日

相关论文

Advances and Open Problems in Federated Learning

Advances and Open Problems in Federated Learning

Arxiv

18+阅读 · 2019年12月10日

Object-centric Forward Modeling for Model Predictive Control

Object-centric Forward Modeling for Model Predictive Control

Arxiv

5+阅读 · 2019年10月8日

Reward learning from human preferences and demonstrations in Atari

Arxiv

8+阅读 · 2018年11月15日

Sample Efficient Adaptive Text-to-Speech

Arxiv

7+阅读 · 2018年9月27日

Large Margin Few-Shot Learning

Arxiv

11+阅读 · 2018年7月8日

Reproducibility Report for "Learning To Count Objects In Natural Images For Visual Question Answering"

Reproducibility Report for "Learning To Count Objects In Natural Images For Visual Question Answering"

Arxiv

4+阅读 · 2018年5月21日

Learning Human Pose Models from Synthesized Data for Robust RGB-D Action Recognition

Arxiv

3+阅读 · 2018年5月1日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

Learning to Evade Static PE Machine Learning Malware Models via Reinforcement Learning

Arxiv

3+阅读 · 2018年1月30日

A Generative Model For Zero Shot Learning Using Conditional Variational Autoencoders

Arxiv

9+阅读 · 2018年1月27日

微信扫码咨询专知VIP会员