人们对利用强化学习(RL)用于信息检索(IR)应用(包括搜索、推荐和广告)非常感兴趣。仅仅在2020年,术语“强化学习”就在ACM SIGIR发表的60多篇不同的论文中被提到。据报道,谷歌和阿里巴巴等互联网公司已经开始从他们基于RL的搜索和推荐引擎中获得竞争优势。这个全天教程为没有或很少有RL经验的IR研究者和实践者提供了在实际操作设置中学习现代RL基础知识的机会。此外,还将介绍和讨论RL在IR系统中的一些代表性应用。通过参加本教程,学员将获得现代RL概念和标准算法(如REINFORCE和DQN)的良好知识。这些知识将帮助他们更好地理解一些最新的涉及RL的IR出版物,以及他们使用RL技术和工具来解决自己实际的IR问题。
目录内容:
Intro RL Basics Multi-armed Bandits Tabular Q-Learning Deep Q-Learning IR applications using DQN Policy Gradient (REINFORCE) IR applications using REINFORCE Actor-Critic IR applications using Actor-Critic Recent developments & outlook for research