Look-alike 是广告领域经典的推荐算法,拥有定向能力强、用户扩展精准等优点。本文在微信看一看的应用场景下对传统 look-alike 进行了改造,使之更适合高时效性的资讯推荐系统。论文原文见附录。
背 景
概 述
未被缓解的马太效应
1. 获取样本:user, item, label。这里以资讯推荐举例,label即是否点击(0/1)。注意,这条样本是最原始的信息,包含这一行为的所有信息量;
2. 拆解特征:直接使用行为样本信息损失当然是最低的,但那意味着失去泛化性。所以我们需要引入用户画像、语义信息、统计信息作为user/item的表达;
3. 训练权重:拟合样本,学习各特征权重。
Look-alike Model
1.** 内容时效性要求高**,一条新闻投放资讯生命周期一般不超过一天。
2. 候选集更新频率高,一天可能有几十上百万条新内容出现。
1. 实时扩展用户,无需更新模型,让资讯第一时间触达受众;
2. 保证推荐的准确性和多样性;
3. 支持在线预测。
模 型
User Representation learning
Look-alike learning
系统架构
离线训练
在线异步处理
在线服务
一些细节和思考
特征
模型调优
冷启动曝光
总结
微信AI
不描摹技术的酷炫,不依赖拟人的形态,微信AI是什么?是悄无声息却无处不在,是用技术创造更高效率,是更懂你。
微信AI关注语音识别与合成、自然语言处理、计算机视觉、工业级推荐系统等领域,成果对内应用于微信翻译、微信视频号、微信看一看等业务,对外服务王者荣耀、QQ音乐等产品。