强化学习(RL)使智能体能够通过动态环境中的交互学习最佳决策。深度学习和强化学习的最新进展使得智能体在各个领域都取得了前所未有的成功,并在许多任务中取得了超人的表现。RL和深度学习影响了当今学术界和工业的几乎所有领域,将它们应用于信息检索(IR)的兴趣越来越大。像谷歌和阿里巴巴这样的公司已经开始使用基于强化学习的搜索和推荐引擎来个性化他们的服务,并在他们的生态系统中增强用户体验。

目前学习RL的在线资源要么专注于理论,牺牲了实践,要么局限于实践,缺乏足够的直觉和理论背景。这个全天的教程是为信息检索研究人员和实践者精心定制的,以获得最流行的RL方法的理论知识和实践经验,使用PyTorch和Python Jupyter 笔记本谷歌Colab。我们的目的是让参加者具备RL的应用知识,帮助他们更好地了解有关RL的最新IR出版物,并使他们能够使用RL解决自己的IR问题。

我们的教程不需要任何关于该主题的知识,并从基本概念和算法开始,如马尔科夫决策过程,探索与利用,Q-学习,决策梯度和Actor-Critic算法。我们特别关注强化学习和深度学习的结合,使用深度Q-Network (DQN)等算法。最后,我们描述了如何利用这些技术来解决代表性的IR问题,如“学习排序”,并讨论了最近的发展以及对未来研究的展望。

目录内容: RL Basics and Tabular Q-Learning Deep Q-Network (DQN) 1/2 (presentation) Deep Q-Network (DQN) 2/2 (hands-on) IR Applications using DQN Policy Gradient (REINFORCE) IR Applications using REINFORCE Actor Critic Outlook

成为VIP会员查看完整内容
33

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
专知会员服务
58+阅读 · 2021年4月7日
如何构建你的推荐系统?这份21页ppt教程为你讲解
专知会员服务
65+阅读 · 2021年2月12日
最新《自动微分》综述教程,71页ppt
专知会员服务
22+阅读 · 2020年11月22日
【ICML2020】强化学习中基于模型的方法,279页ppt
专知会员服务
47+阅读 · 2020年10月26日
最新《序列预测问题导论》教程,212页ppt
专知会员服务
85+阅读 · 2020年8月22日
【DeepMind】强化学习教程,83页ppt
专知会员服务
154+阅读 · 2020年8月7日
深度强化学习策略梯度教程,53页ppt
专知会员服务
182+阅读 · 2020年2月1日
【资源】强化学习实践教程
专知
43+阅读 · 2019年9月11日
强化学习的未来——第一部分
AI研习社
9+阅读 · 2019年1月2日
【干货】强化学习介绍
人工智能学家
13+阅读 · 2018年6月24日
一文学习基于蒙特卡罗的强化学习方法(送书)
人工智能头条
7+阅读 · 2018年3月13日
关于强化学习(附代码,练习和解答)
深度学习
37+阅读 · 2018年1月30日
强化学习族谱
CreateAMind
26+阅读 · 2017年8月2日
Arxiv
4+阅读 · 2021年4月13日
Compression of Deep Learning Models for Text: A Survey
VIP会员
相关VIP内容
专知会员服务
58+阅读 · 2021年4月7日
如何构建你的推荐系统?这份21页ppt教程为你讲解
专知会员服务
65+阅读 · 2021年2月12日
最新《自动微分》综述教程,71页ppt
专知会员服务
22+阅读 · 2020年11月22日
【ICML2020】强化学习中基于模型的方法,279页ppt
专知会员服务
47+阅读 · 2020年10月26日
最新《序列预测问题导论》教程,212页ppt
专知会员服务
85+阅读 · 2020年8月22日
【DeepMind】强化学习教程,83页ppt
专知会员服务
154+阅读 · 2020年8月7日
深度强化学习策略梯度教程,53页ppt
专知会员服务
182+阅读 · 2020年2月1日
相关资讯
【资源】强化学习实践教程
专知
43+阅读 · 2019年9月11日
强化学习的未来——第一部分
AI研习社
9+阅读 · 2019年1月2日
【干货】强化学习介绍
人工智能学家
13+阅读 · 2018年6月24日
一文学习基于蒙特卡罗的强化学习方法(送书)
人工智能头条
7+阅读 · 2018年3月13日
关于强化学习(附代码,练习和解答)
深度学习
37+阅读 · 2018年1月30日
强化学习族谱
CreateAMind
26+阅读 · 2017年8月2日
微信扫码咨询专知VIP会员