滴滴、优步、Lyft等大型代驾平台,将一个城市的数万辆汽车连接到了全天数以百万计的代驾需求上,通过订单调度、车辆重新定位等任务,为提高运输效率提供了巨大的希望。然而,现有的研究通常是在简化的背景下考虑这两项任务,这很难解决两者之间的复杂相互作用、供需之间的实时波动以及由于问题的大规模而需要的协调。在本文中,我们提出了一个统一的基于价值的动态学习框架(V1D3)来处理这两个任务。该框架的中心是一个全球共享的价值函数,它使用实时平台事务生成的在线体验不断更新。为了提高采样效率和鲁棒性,我们进一步提出了一种结合快速在线学习和大规模离线训练的周期集成方法,该方法利用了丰富的驾驶员历史轨迹数据。这使得所提出的框架能够快速适应高度动态的环境,有力地推广到循环模式,并在管理车辆的群体中驱动隐式协调。基于真实数据集的大量实验表明,与最近提出的其他方法相比,这两种方法在这两种任务上都有很大的改进。特别是,V1D3在KDD杯2020 RL比赛中的表现优于调度和重新定位赛道的一等奖得主,在提高驾驶员总收入和用户体验相关指标方面取得了最新成果。

成为VIP会员查看完整内容
8

相关内容

专知会员服务
18+阅读 · 2021年7月11日
专知会员服务
14+阅读 · 2021年6月26日
专知会员服务
45+阅读 · 2021年6月20日
专知会员服务
14+阅读 · 2021年6月16日
专知会员服务
61+阅读 · 2021年6月11日
专知会员服务
25+阅读 · 2021年6月9日
专知会员服务
40+阅读 · 2021年5月24日
【SIGIR2021】基于嵌入的增量式时序知识图谱补全框架
专知会员服务
61+阅读 · 2021年4月21日
【CIKM2020】学习表示解决可解释推荐系统
专知会员服务
47+阅读 · 2020年9月6日
滴滴司机调度系统实践
DataFunTalk
15+阅读 · 2020年8月9日
基于MaaS的智慧交通体系
智能交通技术
11+阅读 · 2019年6月13日
出行即服务(MAAS)框架
智能交通技术
53+阅读 · 2019年5月22日
车路协同构建“通信+计算”新体系
智能交通技术
11+阅读 · 2019年3月26日
大讲堂 | 深度强化学习在电商推荐中的应用
AI研习社
9+阅读 · 2018年11月8日
【质量管理】41页PPT系统学习质量管理体系!
产业智能官
4+阅读 · 2018年2月18日
Arxiv
0+阅读 · 2021年7月16日
Arxiv
13+阅读 · 2020年4月12日
AliCoCo: Alibaba E-commerce Cognitive Concept Net
Arxiv
13+阅读 · 2020年3月30日
Conceptualize and Infer User Needs in E-commerce
Arxiv
3+阅读 · 2019年10月8日
Meta-Transfer Learning for Few-Shot Learning
Arxiv
4+阅读 · 2019年4月9日
Arxiv
6+阅读 · 2018年8月27日
VIP会员
相关主题
相关VIP内容
专知会员服务
18+阅读 · 2021年7月11日
专知会员服务
14+阅读 · 2021年6月26日
专知会员服务
45+阅读 · 2021年6月20日
专知会员服务
14+阅读 · 2021年6月16日
专知会员服务
61+阅读 · 2021年6月11日
专知会员服务
25+阅读 · 2021年6月9日
专知会员服务
40+阅读 · 2021年5月24日
【SIGIR2021】基于嵌入的增量式时序知识图谱补全框架
专知会员服务
61+阅读 · 2021年4月21日
【CIKM2020】学习表示解决可解释推荐系统
专知会员服务
47+阅读 · 2020年9月6日
相关资讯
滴滴司机调度系统实践
DataFunTalk
15+阅读 · 2020年8月9日
基于MaaS的智慧交通体系
智能交通技术
11+阅读 · 2019年6月13日
出行即服务(MAAS)框架
智能交通技术
53+阅读 · 2019年5月22日
车路协同构建“通信+计算”新体系
智能交通技术
11+阅读 · 2019年3月26日
大讲堂 | 深度强化学习在电商推荐中的应用
AI研习社
9+阅读 · 2018年11月8日
【质量管理】41页PPT系统学习质量管理体系!
产业智能官
4+阅读 · 2018年2月18日
微信扫码咨询专知VIP会员