【SIGIR2021】ScaleFreeCTR：超大规模Embedding推荐模型分布式训练系统

推荐系统广泛应用于在线服务，如搜索广告、新闻推荐和在线广告，提供个性化的预测和推荐来提高用户满意度和在线服务的收益。在推荐系统中，点击率（Click-Through-Rate，CTR）预测用于预测用户在特定上下文对不同商品点击的概率，直接影响到推荐系统的效果。近年来，由于深度学习技术在特征表示方面的良好性能，越来越多的深度点击率预测模型被提出和部署，如Google Play的Wide&Deep[3]、华为应用市场的DeepFM[1]和阿里巴巴的DIN[4]。主流的深度点击率预测模型由Embedding层和MLP层构成（如图1所示[5, 6]）：Embedding层将推荐搜索数据中高维稀疏的id特征（商品id、用户id等）映射为低维稠密向量；MLP层捕捉特征之间的非线性组合关系以得到更为准确的点击率预测值。由于推荐数据十分高维，特征维度可达亿级甚至百亿级别，Embedding层参数量很容易达到百GB甚至TB。面对超大规模Embedding的推荐模型，需要在尽可能少的时间内使用海量数据训练推荐模型的海量参数，以保证模型的时效性和预测效果。因此，如何基于海量数据完成超大规模推荐模型的高效训练，对于推荐系统十分关键。

本文将介绍华为诺亚推荐搜索与AI系统工程联合团队最新发表在SIGIR2021上的研究成果：ScaleFreeCTR: MixCache-based Distributed Training System for CTR Models with Huge Embedding Table。ScaleFreeCTR针对超大规模Embedding的深度推荐模型，提出CPU-GPU协同训练系统，通过自研的MixCache缓存机制和高效的流水线设计，实现CPU-GPU数据传输延迟的降低，提升了并行效率。同等硬件下，训练性能超过HugeCTR的5倍，目前已在华为多个业务场景中应用，ScaleFreeCTR近期将在华为深度学习框架MindSpore进行开源。

成为VIP会员查看完整内容

相关内容

分布式计算

关注 0

分布式計算( Distributed computing )是一種把需要進行大量計算的工程數據分割成小塊，由多台計算機分別計算，在上傳運算結果後，將結果統一合并得出數據結論的科學。目前常見的分布式計算項目通常使用世界各地上千萬志願者計算機的閒置計算能力，通過互聯網進行數據傳輸。如分析計算蛋白質的內部結構和相關藥物的Folding@home項目，該項目結構龐大，需要驚人的計算量，由一台電腦計算是不可能完成的。即使現在有了計算能力超強的超級電腦，但是一些科研機構的經費卻又十分有限。

大规模图神经网络系统综述

专知会员服务

140+阅读 · 2021年3月30日

【KDD2020-Google】神经输入搜索的大规模深度推荐模型

专知会员服务

23+阅读 · 2020年9月8日

【百度】-大规模深度学习广告系统的分布式分层GPU参数服务器，Distributed Hierarchical GPU PS

专知会员服务

24+阅读 · 2020年3月15日

AAAI 2020 | 滴滴&东北大学提出自动结构化剪枝压缩算法框架，性能提升高达120倍

专知会员服务

30+阅读 · 2020年2月26日