主题: Towards Using Batch Reinforcement Learning to Identify Treatment Options in Healthcare
摘要: 在许多健康环境中,我们提供了大量患者的纵向和局部视图(例如,在健康记录中编码的内容,或从各种监视器中记录的内容)。如何利用这些信息改善患者护理?在本次演讲中,我将介绍我们实验室在批量强化学习中所做的工作,这是一个强化学习领域,假设代理可以访问数据,但不能探索操作。我将不仅讨论优化和非策略评估的算法,还将讨论我们为使临床专家更容易指定问题以及处理有效性输出而努力的方式。通过这种方式,我还将谈到我们可以期待批量强化学习解决的问题,以及它不能解决的问题。这项工作是与斯里瓦桑·斯里尼瓦桑、艾萨克·拉格、达夫纳·利夫希茨、奥弗拉·阿米尔、索纳利·帕尔布、毛里齐奥·扎齐、沃尔克·罗斯、彭雪峰、大卫·维尔、易丁、奥马尔·戈特斯曼、利维·雷曼、马蒂厄·科莫罗夫斯基、阿尔多·费萨尔、大卫·桑塔格、弗雷德里克·约翰森、利奥·塞利、阿尼鲁德·拉古、姚·刘、艾玛·布伦斯基尔合作的,以及CS282 2017课程。
演讲人简介: Finale Doshi-Velez,哈佛大学计算机科学系助理教授。