决策理论是现代人工智能和经济学的基础。本课程主要从统计学的角度,也从哲学的角度,为决策理论打下坚实的基础。本课程有两个目的:
深入了解统计决策理论、实验设计的自动化方法,并将其与人类决策联系起来。
通过开发算法和智能代理的实验,将该理论应用到强化学习和人工智能的实际问题中。
课程可分为两部分。
在第一部分,我们介绍了主观概率和效用的概念,以及如何用它们来表示和解决决策问题。然后讨论未知参数的估计和假设检验。最后,我们讨论了顺序抽样、顺序实验,以及更一般的顺序决策。
第二部分是不确定性下的决策研究,特别是强化学习和专家咨询学习。首先,我们研究几个有代表性的统计模型。然后,我们给出了使用这些模型做出最优决策的算法的概述。最后,我们来看看学习如何根据专家的建议来行动的问题,这个领域最近在在线广告、游戏树搜索和优化方面有很多应用。
http://www.cse.chalmers.se/~chrdimi/teaching/optimal_decisions/index.html
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“DM267” 就可以获取《不确定性决策与强化学习,267页pdf,瑞典查尔姆斯理工大学》专知下载链接