上一篇文章转化率预估(pCVR)系列--延迟预估模型(上篇),对pCVR的延迟预估模型的开篇之作”Modeling Delayed Feedback in Display Advertising (paper1)“做了仔细剖析。接下来,再介绍下另外一篇研究延迟预估模型的文章“A Nonparametric Delayed Feedback Model for Conversion Rate Prediction(paper2)”
相同点:与paper1思想一致,paper2也主要是对cvr预估拆解为两个模型conversion model和time delay model。
不同点:paper1主要是基于经验假设转化延迟正好服从指数分布,但实际业务场景,每个广告在不同场景和不同上下文,不同用户的延迟时间的分布也大概率不同,所以,很难预先判定转化延迟服从哪个分布。因此paper2将延迟时间的期望表示形式进行了模型化,通过模型参数自动去拟合不同场景下的数据以及业务的期望分布形态。
CVR建模方法:
参数说明:
相比paper1,参数只是增加了一个矩阵V(L * M),记录核函数中虚拟时间片l & 特征x的权重信息。
Time delay model:
那么,由survival analysis中风险函数的定义h(t)=f(t)/s(t)可以得出,
f(t)=s(t) * h(t),即
风险函数(hazard function) f(t):对每个d拆解为L等份,建立L个虚拟时间片,并借鉴KDE思想通过核函数来拟合f(t),如下:
其中,为强化函数,如下:
为强化函数(intensity function),即
生存函数(survival function)s(t):
与、的关系如下:
conversion model:
与paper1一致,采用lr建模
那么,似然函数可构建如下:
由于,
所以,可简化为
其中,计算如下:
模型训练:
loss func:
EM算法:
总结:
两篇论文思路一致,都是使用两个模型(conversion model和delayed feedback model)来进行cvr预估。paper1主要是基于经验假设转化延迟正好服从指数分布,而paper2将延迟时间的期望表示形式利用核函数进行了模型化。
实际上,我们还可以对paper2进行改进,对DFM用深度神经网络进行建模。哈哈,我们就是沿用此思路进行cvr模型优化,并将优化方法最终在IJCAI2020进行发表。论文内容详情,且听下回分解。
推荐阅读
文本自动摘要任务的“不完全”心得总结番外篇——submodular函数优化
斯坦福大学NLP组Python深度学习自然语言处理工具Stanza试用
太赞了!Springer面向公众开放电子书籍,附65本数学、编程、机器学习、深度学习、数据挖掘、数据科学等书籍链接及打包下载
数学之美中盛赞的 Michael Collins 教授,他的NLP课程要不要收藏?
模型压缩实践系列之——bert-of-theseus,一个非常亲民的bert压缩方法
关于AINLP
AINLP 是一个有趣有AI的自然语言处理社区,专注于 AI、NLP、机器学习、深度学习、推荐算法等相关技术的分享,主题包括文本摘要、智能问答、聊天机器人、机器翻译、自动生成、知识图谱、预训练模型、推荐系统、计算广告、招聘信息、求职经验分享等,欢迎关注!加技术交流群请添加AINLPer(id:ainlper),备注工作/研究方向+加群目的。
阅读至此了,点个在看吧👇