深度神经网络(DNN)模型已被广泛应用于在线广告点击率(CTR)预测。CTR训练框架通常由嵌入层和多层感知机(MLP)组成。在百度搜索广告系统中(又名凤巢,Phoenix Nest),新一代的CTR训练平台变成了PaddleBox,一个基于GPU的参数服务器系统。
在这篇论文中,作者介绍了百度最近更新的CTR训练框架,称为门控增强的多任务神经网络(GemNN)。特别地,他们开发了一种基于神经网络的多任务学习模型用于CTR预估,它以粗粒度到细粒度的方式逐步减少候选广告,并允许上游任务与下游任务之间的参数进行共享,从而提高训练效率。此外,作者还在嵌入层和MLP之间引入了门控机制,用于学习特征交互和控制传递到MLP层的信息流。
作者在百度PaddleBox平台部署了该模型方案,并观察到在离线和在线评估方面都有相当大的改进,它现在已经是百度广告系统的一部分。