强化学习在锦囊位置调控上的探索和实践

2018 年 3 月 22 日 机器学习研究会

                                                       

                                                                                                                                                                                                               


一、背景


在手淘的搜索中,当用户输入query进行搜索之后,一方面有适合他的商品展现出来,另一方面,如何更好地理解用户意图,为其推荐更合适的关键词进行细分查找,从而更高效的引导用户到他想找的商品,也是一件非常重要的事情。


因此在手淘搜索场景下,我们以“锦囊”这种产品形态来承载对用户意图的理解和细分,关于锦囊更完整的介绍请见:https://www.atatech.org/articles/80706  


同时锦囊的内容也分了不同的类型,比如从标题抽取出来的tag标签,相关搜索,以及和query相关的品牌和其它的各种属性值,如裙长,袖长等。如下图所示:



在这里,我们主要解决的问题是如何根据用户的历史以及实时行为,在当前query下,为他推荐更合适的锦囊类型,比如有的用户对品牌感兴趣,有的用户对风格感兴趣,那么就会根据实时的信息,在合适的页面展现合适的锦囊类型。以提高用户对锦囊的点击率,进而提升引导效率。



转自:云栖社区


完整内容请点击“阅读原文

登录查看更多
0

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【ICML2020】对比多视角表示学习
专知会员服务
52+阅读 · 2020年6月28日
多智能体深度强化学习的若干关键科学问题
专知会员服务
175+阅读 · 2020年5月24日
强化学习和最优控制的《十个关键点》81页PPT汇总
专知会员服务
102+阅读 · 2020年3月2日
【书籍】深度学习框架:PyTorch入门与实践(附代码)
专知会员服务
160+阅读 · 2019年10月28日
可解释推荐:综述与新视角
专知会员服务
108+阅读 · 2019年10月13日
MIT新书《强化学习与最优控制》
专知会员服务
270+阅读 · 2019年10月9日
智能时代,图像检索技术在美团APP中的应用分析
人人都是产品经理
9+阅读 · 2018年5月23日
机器学习在热门微博推荐系统的应用
人工智能头条
6+阅读 · 2018年1月25日
推荐算法:Match与Rank模型的交织配合
从0到1
15+阅读 · 2017年12月18日
京东用户画像揭秘:原来买iPhone X的是这么些人
R语言中文社区
10+阅读 · 2017年9月14日
【强化学习】如何开启强化学习的大门?
产业智能官
13+阅读 · 2017年9月10日
达观数据NLP技术的应用实践和案例分析
数据挖掘入门与实战
10+阅读 · 2017年7月27日
Deep Learning in Video Multi-Object Tracking: A Survey
Arxiv
55+阅读 · 2019年7月31日
Arxiv
9+阅读 · 2018年4月20日
VIP会员
相关VIP内容
【ICML2020】对比多视角表示学习
专知会员服务
52+阅读 · 2020年6月28日
多智能体深度强化学习的若干关键科学问题
专知会员服务
175+阅读 · 2020年5月24日
强化学习和最优控制的《十个关键点》81页PPT汇总
专知会员服务
102+阅读 · 2020年3月2日
【书籍】深度学习框架:PyTorch入门与实践(附代码)
专知会员服务
160+阅读 · 2019年10月28日
可解释推荐:综述与新视角
专知会员服务
108+阅读 · 2019年10月13日
MIT新书《强化学习与最优控制》
专知会员服务
270+阅读 · 2019年10月9日
相关资讯
智能时代,图像检索技术在美团APP中的应用分析
人人都是产品经理
9+阅读 · 2018年5月23日
机器学习在热门微博推荐系统的应用
人工智能头条
6+阅读 · 2018年1月25日
推荐算法:Match与Rank模型的交织配合
从0到1
15+阅读 · 2017年12月18日
京东用户画像揭秘:原来买iPhone X的是这么些人
R语言中文社区
10+阅读 · 2017年9月14日
【强化学习】如何开启强化学习的大门?
产业智能官
13+阅读 · 2017年9月10日
达观数据NLP技术的应用实践和案例分析
数据挖掘入门与实战
10+阅读 · 2017年7月27日
Top
微信扫码咨询专知VIP会员