Exploration in Online Advertising Systems with Deep Uncertainty-Aware Learning
基于深度置信度感知学习的广告投放探索方案
摘要:目前先进的在线广告系统得益于个性化方法,例如点击率预估技术。依托于深度学习丰富的表示能力,深层点击率预估模型在工业界获得大规模应用,并取得了巨大成功。但是,这些方法可能会受限于“缺乏探索”问题。此前的一系列工作借助上下文赌博机(Contextual Bandit)方法来解决探索与利用的权衡问题,但这些方法难以兼容深层模型,因而表示能力受限。
在本文中,我们提出了一种新颖的深度置信度感知学习(DUAL)方法,基于高斯过程(Gaussian Process)学习点击率模型。该方法可以在保持深层模型灵活表示能力的同时,提供模型预估不确定性的估计。DUAL可以轻松地在现有模型上实现,并以极少的额外计算开销部署于实时系统中。通过结合DUAL对模型预估不确定性的估计能力与Bandit算法,我们进一步提出了基于DUAL的广告投放策略,以提高广告系统的长期效用。在几个公共数据集上的实验结果均表明了该方法的有效性。同时,在阿里巴巴展示外投广告平台上部署的在线A/B测试结果显示,DUAL方法显著提升了平台收入等指标。 论文下载:
https://www.zhuanzhi.ai/paper/63a6cc77b85e7ae3367742b46acacf74