▐ 5 总结与展望
传统的拍卖机制(例如GSP/VCG)由于分配规则确定且专注于优化单一目标(例如收入/社会福利),在优化多利益方指标时可能是次优解;而经典的uGSP则严重依赖预估模型的准确性,缺乏直接对标终局效果的自适应调控能力。为了解决该问题,阿里妈妈展示广告机制策略算法团队提出一种基于深度学习的拍卖机制设计方法 —— Deep Neural Auction (DNA)。在大规模离线数据集实验以及在线A/B实验中,DNA 机制对比传统拍卖机制在优化多利益方指标上都展现出了更好的效果。
AI is increasingly making decisions, not only for us, but also about us. 最近几年利用深度学习建模博弈关系的研究工作越来越多,基于深度学习的拍卖机制设计在工业界仍具有非常强的落地价值和研究前景,仍然有很多新的方向可以继续探索。比如:如何抽象出更好的优化目标来描述机制的长期效果,并融入机制模型的优化。另外,广告机制策略的另一大组成部分——出价(bidding),近几年也逐渐切换到了基于数据驱动的智能出价技术,那么拍卖智能体(Auction Agent)与出价智能体(Auto-bidding Agent)之间该如何协同,两个可学习agent之间的动态博弈关系是怎样的,异步学习会不会造成效果震荡,这些问题同样值得深入研究。