直播预告 | 强化学习在共享出行平台中推荐、派单和调度上的应用

2020 年 5 月 8 日 DataFunTalk

Di Live | 顶会顶刊分享系列:

5月9日(周六)中午14点,滴滴 AI Labs专家算法工程师唐小程为大家带来 KDD CUP 2020滴滴赛题全览——教你如何在共享出行平台上派单和调度。

此外,我们还邀请到了滴滴 AI Labs专家研究员李卿阳,为大家带来WWW 2020论文解读——探索资源约束的 Contextual Bandits 问题。


01

课程预告


本期「Di Live」邀请到滴滴 AI Labs专家算法工程师唐小程为大家带来 KDD CUP 2020滴滴赛题全览——教你如何在共享出行平台上派单和调度



此外,我们还邀请到了滴滴 AI Labs专家研究员李卿阳,为大家带来WWW 2020论文解读——探索资源约束的 Contextual Bandits 问题。


Contextual bandits (CB) 因为强大的序列决策能力,已经被广泛的应到推荐系统和广告优化中。在现实世界的应用中,在线学习的成本往往是比较高的,一个折中的方案是给策略的学习设定一个探索资源的约束。所以这个问题转变成如何在固定的探索资源预算约束下,去平衡 exploration(探索)和 exploitation(挖掘)的问题。


本文提出了一种层次化结构的优化方法,达到资源分配策略和个性化推荐策略同时优化的目的。该方法在 Yahoo 的广告数据上得到了验证,并且在理论上证明了 regret bound 是 O(√T)。


本次分享的具体内容为:

  • 强化学习 Contextual Bandits 背景介绍

  • 基于层次自适应的 Contextual Bandits 方法

  • 累积遗憾(Cumulative Regret)分析

  • 实验结果验证

  • 方法总结


02

嘉宾介绍

唐小程

滴滴AI Labs专家算法工程师

唐小程博士,滴滴AI Labs/美国研究院专家算法工程师,美国理海大学优化运筹学博士学位,曾先后就职于 IBM Watson,硅谷雅虎 Labs,初创公司 Pivotal Software。


李卿阳 

滴滴AI Labs专家研究员 

李卿阳博士,滴滴 AI Labs/美国研究院专家研究科学家。 致力于网约车交易平台的供需策略优化。博士毕业于美国亚利桑那州立大学,拥有计算机博士学位,本科毕业于北京航空航天大学计算机专业。


03

活动报名


扫码添加DataFun小助手,回复“DiDi”,预约直播及回放:



04

精美礼品

每位嘉宾分享结束后,将从提问和填写问卷的同学中随机选取5位小伙伴分别获得20元滴滴快车充值卡一张,还有机会获得桔园精美U盘。欢迎同学们积极参与!



——END——
文章推荐:
Apache Flink在滴滴的应用与实践
从算法到应用:滴滴端到端语音AI技术实践
强化学习在滴滴车服用户运营中的实践

关于我们:

DataFunTalk 专注于大数据、人工智能技术应用的分享与交流。发起于2017年,在北京、上海、深圳、杭州等城市举办超过100场线下沙龙、论坛及峰会,已邀请近500位专家和学者参与分享。其公众号DataFunTalk累计生产原创文章400+百万+阅读,5万+精准粉丝。

一个在看,一段时光👇

登录查看更多
0

相关内容

【IJCAI2020-华为诺亚】面向深度强化学习的策略迁移框架
专知会员服务
28+阅读 · 2020年5月25日
深度强化学习策略梯度教程,53页ppt
专知会员服务
182+阅读 · 2020年2月1日
出行即服务(MAAS)框架
智能交通技术
53+阅读 · 2019年5月22日
已删除
将门创投
3+阅读 · 2019年4月25日
大讲堂 | 深度强化学习在电商推荐中的应用
AI研习社
9+阅读 · 2018年11月8日
公开课 | 强化学习及其在 NLP 上的应用
AI研习社
4+阅读 · 2018年6月14日
直播 | Python+AI:Python 学习者的人工智能入门课
AI研习社
4+阅读 · 2018年5月13日
直播 | Python+AI:Python学习者的人工智能入门课
AI科技评论
4+阅读 · 2018年5月11日
极市分享|王晋东 迁移学习中的领域自适应方法
极市平台
10+阅读 · 2017年12月11日
课程 | 推荐系统资深架构师在这里等你!
AI研习社
3+阅读 · 2017年9月7日
HAQ: Hardware-Aware Automated Quantization
Arxiv
6+阅读 · 2018年11月21日
Meta-Learning with Latent Embedding Optimization
Arxiv
6+阅读 · 2018年7月16日
Arxiv
5+阅读 · 2018年4月22日
Arxiv
19+阅读 · 2018年3月28日
Arxiv
5+阅读 · 2015年9月14日
VIP会员
相关VIP内容
【IJCAI2020-华为诺亚】面向深度强化学习的策略迁移框架
专知会员服务
28+阅读 · 2020年5月25日
深度强化学习策略梯度教程,53页ppt
专知会员服务
182+阅读 · 2020年2月1日
相关资讯
出行即服务(MAAS)框架
智能交通技术
53+阅读 · 2019年5月22日
已删除
将门创投
3+阅读 · 2019年4月25日
大讲堂 | 深度强化学习在电商推荐中的应用
AI研习社
9+阅读 · 2018年11月8日
公开课 | 强化学习及其在 NLP 上的应用
AI研习社
4+阅读 · 2018年6月14日
直播 | Python+AI:Python 学习者的人工智能入门课
AI研习社
4+阅读 · 2018年5月13日
直播 | Python+AI:Python学习者的人工智能入门课
AI科技评论
4+阅读 · 2018年5月11日
极市分享|王晋东 迁移学习中的领域自适应方法
极市平台
10+阅读 · 2017年12月11日
课程 | 推荐系统资深架构师在这里等你!
AI研习社
3+阅读 · 2017年9月7日
Top
微信扫码咨询专知VIP会员