VIP内容 - 专知

自2017年以来一直是Facebook AI Research（FAIR）实验室的研究科学家，他之前是SequeL团队Inria的研究员。他的主要研究主题是强化学习，在RL的理论和算法方面都做出了巨大贡献。在过去的十年中，他研究了多臂土匪和强化学习框架中的勘探与开发困境，特别是在遗憾最小化，最佳武器识别，纯粹探索和分层RL等问题上。

【ALT 2019 Tutorials】强化学习的探索性开发（Exploration-Exploitation in Reinforcement Learning）

专知会员服务

34+阅读 · 2019年3月21日

参考链接

微信扫码咨询专知VIP会员

Top