强化学习如何用于信息检索？请看ECIR2021《基于强化学习的信息检索》教程，附175页ppt与视频 - 专知

会员服务 ·

0

强化学习如何用于信息检索？请看ECIR2021《基于强化学习的信息检索》教程，附175页ppt与视频

2021 年 4 月 1 日 专知

强化学习(RL)使智能体能够通过动态环境中的交互学习最佳决策。深度学习和强化学习的最新进展使得智能体在各个领域都取得了前所未有的成功，并在许多任务中取得了超人的表现。RL和深度学习影响了当今学术界和工业的几乎所有领域，将它们应用于信息检索(IR)的兴趣越来越大。像谷歌和阿里巴巴这样的公司已经开始使用基于强化学习的搜索和推荐引擎来个性化他们的服务，并在他们的生态系统中增强用户体验。

目前学习RL的在线资源要么专注于理论，牺牲了实践，要么局限于实践，缺乏足够的直觉和理论背景。这个全天的教程是为信息检索研究人员和实践者精心定制的，以获得最流行的RL方法的理论知识和实践经验，使用PyTorch和Python Jupyter 笔记本谷歌Colab。我们的目的是让参加者具备RL的应用知识，帮助他们更好地了解有关RL的最新IR出版物，并使他们能够使用RL解决自己的IR问题。

我们的教程不需要任何关于该主题的知识，并从基本概念和算法开始，如马尔科夫决策过程，探索与利用，Q-学习，决策梯度和Actor-Critic算法。我们特别关注强化学习和深度学习的结合，使用深度Q-Network (DQN)等算法。最后，我们描述了如何利用这些技术来解决代表性的IR问题，如“学习排序”，并讨论了最近的发展以及对未来研究的展望。

目录内容：

RL Basics and Tabular Q-Learning
Deep Q-Network (DQN) 1/2 (presentation)
Coffee Break
Deep Q-Network (DQN) 2/2 (hands-on)
IR Applications using DQN
Lunch Break (45 minutes extra)
Policy Gradient (REINFORCE)
IR Applications using REINFORCE
Actor Critic
Outlook

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“RLIR” 就可以获取《强化学习如何用于信息检索？请看ECIR2021《基于强化学习的信息检索》教程，附175页ppt与视频》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

2

相关内容

信息检索

信息检索( Information Retrieval )指信息按一定的方式组织起来，并根据信息用户的需要找出有关的信息的过程和技术。信息检索的目标：准确、及时、全面的获取所需信息。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

对抗学习如何应用到推荐系统？ECIR2021<对抗学习推荐系统>教程，197页ppt

专知会员服务

46+阅读 · 2021年3月29日

「元学习」最新AAAI2021-Tutorial，附视频与240页ppt

「元学习」最新AAAI2021-Tutorial，附视频与240页ppt

专知会员服务

117+阅读 · 2021年2月7日

最新《Transformers模型》教程，64页ppt

最新《Transformers模型》教程，64页ppt

专知会员服务

321+阅读 · 2020年11月26日

【ICML2020】强化学习中基于模型的方法，279页ppt

【ICML2020】强化学习中基于模型的方法，279页ppt

专知会员服务

47+阅读 · 2020年10月26日

【PKDD2020教程】机器学习不确定性，附88页ppt与视频

【PKDD2020教程】机器学习不确定性，附88页ppt与视频

专知会员服务

95+阅读 · 2020年10月18日

【DeepMind】强化学习教程，83页ppt

【DeepMind】强化学习教程，83页ppt

专知会员服务

158+阅读 · 2020年8月7日

【ICML2020】基于模型的强化学习方法教程，279页ppt

【ICML2020】基于模型的强化学习方法教程，279页ppt

专知会员服务

129+阅读 · 2020年7月20日

《强化学习》简介小册，24页pdf

《强化学习》简介小册，24页pdf

专知会员服务

277+阅读 · 2020年4月19日

WSDM2020教程《基于图学习和推理的推荐系统》，附130页PPT下载

WSDM2020教程《基于图学习和推理的推荐系统》，附130页PPT下载

专知会员服务

217+阅读 · 2020年2月15日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

NeurIPS2020最新Google《图学习与挖掘》综述教程，附312页ppt与视频

NeurIPS2020最新Google《图学习与挖掘》综述教程，附312页ppt与视频

专知

22+阅读 · 2020年12月9日

AACL2020最新《可解释人工智能与自然语言处理可解释性》教程，附159页ppt与视频

AACL2020最新《可解释人工智能与自然语言处理可解释性》教程，附159页ppt与视频

专知

25+阅读 · 2020年12月6日

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

专知

40+阅读 · 2020年6月20日

【牛津大学&DeepMind】自监督学习教程，141页ppt

【牛津大学&DeepMind】自监督学习教程，141页ppt

专知

16+阅读 · 2020年5月29日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

【资源】强化学习实践教程

【资源】强化学习实践教程

专知

43+阅读 · 2019年9月11日

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

专知

52+阅读 · 2019年1月3日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

基于深度学习的文本生成【附217页PPT下载】

基于深度学习的文本生成【附217页PPT下载】

专知

35+阅读 · 2018年11月24日

【微软亚研130PPT教程】强化学习简介

【微软亚研130PPT教程】强化学习简介

专知

36+阅读 · 2018年10月26日

Network insensitivity to parameter noise via adversarial regularization

Arxiv

0+阅读 · 2021年6月9日

Cervical Cytology Classification Using PCA & GWO Enhanced Deep Features Selection

Arxiv

0+阅读 · 2021年6月9日

Contrastive Triple Extraction with Generative Transformer

Arxiv

3+阅读 · 2020年9月14日

Generating Fact Checking Explanations

Generating Fact Checking Explanations

Arxiv

9+阅读 · 2020年4月13日

Generalization and Regularization in DQN

Generalization and Regularization in DQN

Arxiv

6+阅读 · 2019年1月30日

Reward learning from human preferences and demonstrations in Atari

Arxiv

8+阅读 · 2018年11月15日

Generative Dual Adversarial Network for Generalized Zero-shot Learning

Arxiv

7+阅读 · 2018年11月12日

Controllable Generative Adversarial Network

Arxiv

5+阅读 · 2018年5月1日

A Generative Model For Zero Shot Learning Using Conditional Variational Autoencoders

Arxiv

9+阅读 · 2018年1月27日

Generating Adversarial Examples with Adversarial Networks

Arxiv

10+阅读 · 2018年1月15日

VIP会员

相关主题

相关VIP内容

对抗学习如何应用到推荐系统？ECIR2021<对抗学习推荐系统>教程，197页ppt

专知会员服务

46+阅读 · 2021年3月29日

「元学习」最新AAAI2021-Tutorial，附视频与240页ppt

「元学习」最新AAAI2021-Tutorial，附视频与240页ppt

专知会员服务

117+阅读 · 2021年2月7日

最新《Transformers模型》教程，64页ppt

最新《Transformers模型》教程，64页ppt

专知会员服务

321+阅读 · 2020年11月26日

【ICML2020】强化学习中基于模型的方法，279页ppt

【ICML2020】强化学习中基于模型的方法，279页ppt

专知会员服务

47+阅读 · 2020年10月26日

【PKDD2020教程】机器学习不确定性，附88页ppt与视频

【PKDD2020教程】机器学习不确定性，附88页ppt与视频

专知会员服务

95+阅读 · 2020年10月18日

【DeepMind】强化学习教程，83页ppt

【DeepMind】强化学习教程，83页ppt

专知会员服务

158+阅读 · 2020年8月7日

【ICML2020】基于模型的强化学习方法教程，279页ppt

【ICML2020】基于模型的强化学习方法教程，279页ppt

专知会员服务

129+阅读 · 2020年7月20日

《强化学习》简介小册，24页pdf

《强化学习》简介小册，24页pdf

专知会员服务

277+阅读 · 2020年4月19日

WSDM2020教程《基于图学习和推理的推荐系统》，附130页PPT下载

WSDM2020教程《基于图学习和推理的推荐系统》，附130页PPT下载

专知会员服务

217+阅读 · 2020年2月15日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

热门VIP内容

开通专知VIP会员享更多权益服务

【伯克利博士论文】通过真实世界实践赋能机器人自主性

军用无人机集群技术尚未成熟——但潜力可期

人工智能安全治理白皮书（2025）

AgentOps综述：分类、挑战与未来方向

相关资讯

NeurIPS2020最新Google《图学习与挖掘》综述教程，附312页ppt与视频

NeurIPS2020最新Google《图学习与挖掘》综述教程，附312页ppt与视频

专知

22+阅读 · 2020年12月9日

AACL2020最新《可解释人工智能与自然语言处理可解释性》教程，附159页ppt与视频

AACL2020最新《可解释人工智能与自然语言处理可解释性》教程，附159页ppt与视频

专知

25+阅读 · 2020年12月6日

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

专知

40+阅读 · 2020年6月20日

【牛津大学&DeepMind】自监督学习教程，141页ppt

【牛津大学&DeepMind】自监督学习教程，141页ppt

专知

16+阅读 · 2020年5月29日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

【资源】强化学习实践教程

【资源】强化学习实践教程

专知

43+阅读 · 2019年9月11日

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

专知

52+阅读 · 2019年1月3日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

基于深度学习的文本生成【附217页PPT下载】

基于深度学习的文本生成【附217页PPT下载】

专知

35+阅读 · 2018年11月24日

【微软亚研130PPT教程】强化学习简介

【微软亚研130PPT教程】强化学习简介

专知

36+阅读 · 2018年10月26日

相关论文

Network insensitivity to parameter noise via adversarial regularization

Arxiv

0+阅读 · 2021年6月9日

Cervical Cytology Classification Using PCA & GWO Enhanced Deep Features Selection

Arxiv

0+阅读 · 2021年6月9日

Contrastive Triple Extraction with Generative Transformer

Arxiv

3+阅读 · 2020年9月14日

Generating Fact Checking Explanations

Generating Fact Checking Explanations

Arxiv

9+阅读 · 2020年4月13日

Generalization and Regularization in DQN

Generalization and Regularization in DQN

Arxiv

6+阅读 · 2019年1月30日

Reward learning from human preferences and demonstrations in Atari

Arxiv

8+阅读 · 2018年11月15日

Generative Dual Adversarial Network for Generalized Zero-shot Learning

Arxiv

7+阅读 · 2018年11月12日

Controllable Generative Adversarial Network

Arxiv

5+阅读 · 2018年5月1日

A Generative Model For Zero Shot Learning Using Conditional Variational Autoencoders

Arxiv

9+阅读 · 2018年1月27日

Generating Adversarial Examples with Adversarial Networks

Arxiv

10+阅读 · 2018年1月15日

大家都在搜

大型语言模型

国防科技创新

软件无线电

久别重逢话双塔

再见，TD-SCDMA！

微信扫码咨询专知VIP会员