Multi-Agent Cooperative Bidding Games for Multi-Objective Optimization in e-Commercial Sponsored Search

基于多智能体协同竞价博弈的电商搜索广告多目标竞价优化

摘要:在线广告是一种以互联网为载体,帮助广告主触达目标消费者,从而实现商业诉求的广告形式。在线广告通常通过实时竞价的方式决定胜出者。电商搜索广告是一种主流的在线广告:消费者在电商平台表达搜索请求,触发相关广告主的实时竞价以及平台流量分配,并带来可能的成交行为。在高度动态的电商市场,每天通常有数百万的广告主,这些广告主诉求各异,经由上千亿次的实时竞价竞争接近百亿次的用户曝光。如何在如此大规模的电商流量场景下,通过优化实时竞价,满足广告主多样化目标诉求是一个颇具挑战的问题。学术界和工业界已经深入研究了单广告主视角的竞价优化问题,这些研究往往即假设其他竞争者不改变出价,这一强假设往往不成立,导致策略在运用于多广告主真实竞价时往往表现较差。少量现有工作从多广告主视角,利用多智能体强化学习,通过构建一致的目标进行出价的协同优化,但他们存在如下缺陷:(1)由于信息完全共享,这些方法很难避免多广告主串谋的问题,一种显而易见的更优解是广告主串通出较低价竞价流量,导致平台收益受损;(2)在复杂动态的竞价环境中,这些策略需要较长时间收敛并且极度不稳定。此外,针对电商搜索广告竞价优化问题,以往的工作很少考虑同时优化广告主多样化的诉求目标。

针对以上问题,本文提出了一套新颖的多目标协同出价优化框架,即多智能体协同出价博弈。在该合作博弈框架中,本文通过引入一个全局的目标以优化所有广告主的总体利益,鼓励了广告主更好的协同,从而间接保护了自主出价广告主的利益,使得流量分配更加公平。为解决多广告主串谋问题,本文也额外引入了平台的收入作为约束。本文通过理论分析给出了最优出价公式的泛函形式,并设计了一种策略网络用于探索泛函出价公式中的最优参数。为寻找最优参数,本文同时设计了一种高效的多智能体进化策略搜索算法。进化策略不需要显式建模动态环境,使得求解过程具有更好的鲁棒性。淘宝搜索广告平台上广泛的离线评测和在线A/B测试,都显示本文的方法显著优于现有最新的工作。该模型已经上线部署到淘宝搜索广告平台,每天服务上百万广告主的实时竞价优化,使得整体大盘效率指标以及广告主自身诉求均有5%以上提升。

论文下载: https://www.zhuanzhi.ai/paper/96bacab511dabf1b4b213f1e229d58bb

成为VIP会员查看完整内容
34

相关内容

专知会员服务
21+阅读 · 2021年7月14日
专知会员服务
14+阅读 · 2021年6月16日
【2021新书】分布式优化,博弈和学习算法,227页pdf
专知会员服务
227+阅读 · 2021年5月25日
专知会员服务
12+阅读 · 2021年3月13日
【NeurIPS 2020 】神经网络结构生成优化
专知会员服务
20+阅读 · 2020年10月24日
专知会员服务
20+阅读 · 2020年10月4日
【CIKM2020-阿里】在线序列广告的用户隐藏状态推断
专知会员服务
24+阅读 · 2020年9月5日
计算广告发展历程——从CPC到oCPX
AINLP
7+阅读 · 2020年7月29日
oCPC:计算广告出价策略
AINLP
8+阅读 · 2020年6月2日
广告算法在阿里文娱用户增长中的实践
DataFunTalk
7+阅读 · 2020年3月11日
美团点评旅游搜索召回策略的演进
美团技术团队
4+阅读 · 2017年6月16日
Modified Double DQN: addressing stability
Arxiv
0+阅读 · 2021年8月9日
Imitation by Predicting Observations
Arxiv
4+阅读 · 2021年7月8日
VIP会员
相关VIP内容
专知会员服务
21+阅读 · 2021年7月14日
专知会员服务
14+阅读 · 2021年6月16日
【2021新书】分布式优化,博弈和学习算法,227页pdf
专知会员服务
227+阅读 · 2021年5月25日
专知会员服务
12+阅读 · 2021年3月13日
【NeurIPS 2020 】神经网络结构生成优化
专知会员服务
20+阅读 · 2020年10月24日
专知会员服务
20+阅读 · 2020年10月4日
【CIKM2020-阿里】在线序列广告的用户隐藏状态推断
专知会员服务
24+阅读 · 2020年9月5日
微信扫码咨询专知VIP会员