【斯坦福博士论文】面向行业级神经推荐的数据驱动统计分片，110页pdf - 专知

会员服务 ·

0

【斯坦福博士论文】面向行业级神经推荐的数据驱动统计分片，110页pdf

2023 年 4 月 6 日 专知

基于深度学习的推荐模型(DLRMs)构成了许多互联网规模的服务的主干，如网络搜索、社交媒体和视频流。这些模型主要由大量的嵌入表组成，可能有tb大小，需要大量的系统资源来训练和解决分片问题。分片问题是将嵌入表参数划分并放置在整个目标系统内存拓扑结构中，以使训练吞吐量最大化的任务。

本文主要工作:(1)对DLRM训练数据进行特征提取和统计，用于准确、细粒度地预测单个嵌入表行的内存需求;(2)提出了一种基于混合整数线性规划的分片方法RecShard，该方法利用这些统计信息来解决容量受限的单节点系统的分片问题，其中参数必须放置在高性能的GPU HBM和慢得多的CPU DRAM之间;减少对后者的访问;(3)提出了FlexShard，一种精确的行级分片算法，专注于跨多节点GPU训练集群对新兴的基于序列的DLRMs进行分片;利用这些统计数据可以显著减少节点间通信需求，这是向外扩展DLRM训练的瓶颈。

行业规模的DLRMs需要进行分片;然而，偏倚的DLRM训练数据幂律性质导致不精确的划分和放置决策，从而导致系统内存拓扑的负载不均衡。本文的工作为深入分析DLRM的细粒度内存访问模式提供了基础;以及两种基于此基础的新分片技术。这些技术在实际生产数据和系统部署上比之前的最先进技术有了显著改进。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复或发消息“S110” 就可以获取《【斯坦福博士论文】面向行业级神经推荐的数据驱动统计分片，110页pdf》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取100000+AI(AI与军事、医药、公安等)主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取100000+AI主题知识资料

登录查看更多

3

相关内容

神经推荐

【斯坦福博士论文】深度学习核编译为局部感知数据流，109页pdf

【斯坦福博士论文】深度学习核编译为局部感知数据流，109页pdf

专知会员服务

28+阅读 · 2023年4月5日

【博士论文】面向应用环境下深度学习方法的持续学习，195页pdf

【博士论文】面向应用环境下深度学习方法的持续学习，195页pdf

专知会员服务

28+阅读 · 2023年3月4日

【干货书】分布式机器学习的优化算法，137页pdf

【干货书】分布式机器学习的优化算法，137页pdf

专知会员服务

74+阅读 · 2022年12月14日

【MIT博士论文】机器学习中的稀疏性:理论与应用，122页pdf

【MIT博士论文】机器学习中的稀疏性:理论与应用，122页pdf

专知会员服务

56+阅读 · 2022年11月21日

【斯坦福博士论文】基于压缩模型高效验证的可信机器学习，90页pdf

【斯坦福博士论文】基于压缩模型高效验证的可信机器学习，90页pdf

专知会员服务

37+阅读 · 2022年9月16日

【斯坦福博士论文】机器学习系统高效部署的理论和算法，155页pdf

【斯坦福博士论文】机器学习系统高效部署的理论和算法，155页pdf

专知会员服务

47+阅读 · 2022年9月9日

【2022新书】机器学习与数据科学:基础与应用，272页pdf

【2022新书】机器学习与数据科学:基础与应用，272页pdf

专知会员服务

109+阅读 · 2022年8月3日

【干货书】系统性能: 企业和云，第二版，154页pdf

专知会员服务

29+阅读 · 2021年5月12日

【斯坦福】分布式算法与优化，118页pdf

专知会员服务

82+阅读 · 2020年12月22日

【干货】面向机器学习和数据分析的特征工程，附新书419页pdf

【干货】面向机器学习和数据分析的特征工程，附新书419页pdf

专知会员服务

157+阅读 · 2019年11月26日

【2022新书】深度学习归一化技术，117页pdf

【2022新书】深度学习归一化技术，117页pdf

专知

28+阅读 · 2022年11月25日

【MIT博士论文】机器学习中的稀疏性:理论与应用，122页pdf

【MIT博士论文】机器学习中的稀疏性:理论与应用，122页pdf

专知

6+阅读 · 2022年11月21日

【牛津大学博士论文】深度学习数据驱动发现偏微分方程，160页pdf

【牛津大学博士论文】深度学习数据驱动发现偏微分方程，160页pdf

专知

2+阅读 · 2022年11月1日

【牛津大学博士论文】控制微分方程在流数据中的机器学习应用，166页pdf

【牛津大学博士论文】控制微分方程在流数据中的机器学习应用，166页pdf

专知

4+阅读 · 2022年10月27日

【2022新书】基于计算智能的时间序列分析，191页pdf

【2022新书】基于计算智能的时间序列分析，191页pdf

专知

8+阅读 · 2022年10月20日

【牛津大学博士论文】深度学习临床前药物发现，251页pdf

【牛津大学博士论文】深度学习临床前药物发现，251页pdf

专知

2+阅读 · 2022年9月30日

【斯坦福博士论文】机器学习系统高效部署的理论和算法，155页pdf

【斯坦福博士论文】机器学习系统高效部署的理论和算法，155页pdf

专知

3+阅读 · 2022年9月9日

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

专知

5+阅读 · 2022年9月7日

【2022新书】机器学习与数据科学:基础与应用，272页pdf

【2022新书】机器学习与数据科学:基础与应用，272页pdf

专知

25+阅读 · 2022年8月3日

【MIT博士论文】优化理论与机器学习实践

【MIT博士论文】优化理论与机器学习实践

专知

2+阅读 · 2022年6月30日

数据驱动下矿渣微粉生产过程的智能控制

国家自然科学基金

0+阅读 · 2014年12月31日

面向文本信息安全的类别语义模型分类方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

虚拟化数据中心内存资源预测与动态调配

国家自然科学基金

0+阅读 · 2012年12月31日

面向可持续制造的车间能耗建模及优化技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

复杂网络模块结构与链接结构的统计建模及识别研究

国家自然科学基金

1+阅读 · 2012年12月31日

面向实时感知应用的复杂事件代数模型与检测方法研究

国家自然科学基金

0+阅读 · 2011年12月31日

面向无线传感器网络不确定性数据的Rank查询与优化的研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于图的统计机器翻译方法研究

国家自然科学基金

2+阅读 · 2010年12月31日

电网参数分检式估计方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

分布式数据流的集成模式挖掘模型和概念漂移检测算法研究

国家自然科学基金

2+阅读 · 2008年12月31日

Sampling Ex-Post Group-Fair Rankings

Arxiv

0+阅读 · 2023年5月29日

A barrier for further approximating Sorting By Transpositions

Arxiv

0+阅读 · 2023年5月28日

On Consistent Bayesian Inference from Synthetic Data

Arxiv

0+阅读 · 2023年5月26日

Physics-Informed Machine Learning: A Survey on Problems, Methods and Applications

Arxiv

72+阅读 · 2022年11月15日

A Battle of Network Structures: An Empirical Study of CNN, Transformer, and MLP

Arxiv

12+阅读 · 2021年8月30日

Informed Machine Learning -- A Taxonomy and Survey of Integrating Knowledge into Learning Systems

Arxiv

37+阅读 · 2021年5月28日

A Survey on Knowledge Graphs: Representation, Acquisition and Applications

Arxiv

32+阅读 · 2021年1月17日

Pre-trained Models for Natural Language Processing: A Survey

Arxiv

113+阅读 · 2020年3月18日

ALBERT: A Lite BERT for Self-supervised Learning of Language Representations

Arxiv

11+阅读 · 2019年10月30日

Deep Learning for Generic Object Detection: A Survey

Deep Learning for Generic Object Detection: A Survey

Arxiv

14+阅读 · 2018年9月6日

VIP会员

相关主题

相关VIP内容

【斯坦福博士论文】深度学习核编译为局部感知数据流，109页pdf

【斯坦福博士论文】深度学习核编译为局部感知数据流，109页pdf

专知会员服务

28+阅读 · 2023年4月5日

【博士论文】面向应用环境下深度学习方法的持续学习，195页pdf

【博士论文】面向应用环境下深度学习方法的持续学习，195页pdf

专知会员服务

28+阅读 · 2023年3月4日

【干货书】分布式机器学习的优化算法，137页pdf

【干货书】分布式机器学习的优化算法，137页pdf

专知会员服务

74+阅读 · 2022年12月14日

【MIT博士论文】机器学习中的稀疏性:理论与应用，122页pdf

【MIT博士论文】机器学习中的稀疏性:理论与应用，122页pdf

专知会员服务

56+阅读 · 2022年11月21日

【斯坦福博士论文】基于压缩模型高效验证的可信机器学习，90页pdf

【斯坦福博士论文】基于压缩模型高效验证的可信机器学习，90页pdf

专知会员服务

37+阅读 · 2022年9月16日

【斯坦福博士论文】机器学习系统高效部署的理论和算法，155页pdf

【斯坦福博士论文】机器学习系统高效部署的理论和算法，155页pdf

专知会员服务

47+阅读 · 2022年9月9日

【2022新书】机器学习与数据科学:基础与应用，272页pdf

【2022新书】机器学习与数据科学:基础与应用，272页pdf

专知会员服务

109+阅读 · 2022年8月3日

【干货书】系统性能: 企业和云，第二版，154页pdf

专知会员服务

29+阅读 · 2021年5月12日

【斯坦福】分布式算法与优化，118页pdf

专知会员服务

82+阅读 · 2020年12月22日

【干货】面向机器学习和数据分析的特征工程，附新书419页pdf

【干货】面向机器学习和数据分析的特征工程，附新书419页pdf

专知会员服务

157+阅读 · 2019年11月26日

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关资讯

【2022新书】深度学习归一化技术，117页pdf

【2022新书】深度学习归一化技术，117页pdf

专知

28+阅读 · 2022年11月25日

【MIT博士论文】机器学习中的稀疏性:理论与应用，122页pdf

【MIT博士论文】机器学习中的稀疏性:理论与应用，122页pdf

专知

6+阅读 · 2022年11月21日

【牛津大学博士论文】深度学习数据驱动发现偏微分方程，160页pdf

【牛津大学博士论文】深度学习数据驱动发现偏微分方程，160页pdf

专知

2+阅读 · 2022年11月1日

【牛津大学博士论文】控制微分方程在流数据中的机器学习应用，166页pdf

【牛津大学博士论文】控制微分方程在流数据中的机器学习应用，166页pdf

专知

4+阅读 · 2022年10月27日

【2022新书】基于计算智能的时间序列分析，191页pdf

【2022新书】基于计算智能的时间序列分析，191页pdf

专知

8+阅读 · 2022年10月20日

【牛津大学博士论文】深度学习临床前药物发现，251页pdf

【牛津大学博士论文】深度学习临床前药物发现，251页pdf

专知

2+阅读 · 2022年9月30日

【斯坦福博士论文】机器学习系统高效部署的理论和算法，155页pdf

【斯坦福博士论文】机器学习系统高效部署的理论和算法，155页pdf

专知

3+阅读 · 2022年9月9日

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

专知

5+阅读 · 2022年9月7日

【2022新书】机器学习与数据科学:基础与应用，272页pdf

【2022新书】机器学习与数据科学:基础与应用，272页pdf

专知

25+阅读 · 2022年8月3日

【MIT博士论文】优化理论与机器学习实践

【MIT博士论文】优化理论与机器学习实践

专知

2+阅读 · 2022年6月30日

相关基金

数据驱动下矿渣微粉生产过程的智能控制

国家自然科学基金

0+阅读 · 2014年12月31日

面向文本信息安全的类别语义模型分类方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

虚拟化数据中心内存资源预测与动态调配

国家自然科学基金

0+阅读 · 2012年12月31日

面向可持续制造的车间能耗建模及优化技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

复杂网络模块结构与链接结构的统计建模及识别研究

国家自然科学基金

1+阅读 · 2012年12月31日

面向实时感知应用的复杂事件代数模型与检测方法研究

国家自然科学基金

0+阅读 · 2011年12月31日

面向无线传感器网络不确定性数据的Rank查询与优化的研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于图的统计机器翻译方法研究

国家自然科学基金

2+阅读 · 2010年12月31日

电网参数分检式估计方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

分布式数据流的集成模式挖掘模型和概念漂移检测算法研究

国家自然科学基金

2+阅读 · 2008年12月31日

相关论文

Sampling Ex-Post Group-Fair Rankings

Arxiv

0+阅读 · 2023年5月29日

A barrier for further approximating Sorting By Transpositions

Arxiv

0+阅读 · 2023年5月28日

On Consistent Bayesian Inference from Synthetic Data

Arxiv

0+阅读 · 2023年5月26日

Physics-Informed Machine Learning: A Survey on Problems, Methods and Applications

Arxiv

72+阅读 · 2022年11月15日

A Battle of Network Structures: An Empirical Study of CNN, Transformer, and MLP

Arxiv

12+阅读 · 2021年8月30日

Informed Machine Learning -- A Taxonomy and Survey of Integrating Knowledge into Learning Systems

Arxiv

37+阅读 · 2021年5月28日

A Survey on Knowledge Graphs: Representation, Acquisition and Applications

Arxiv

32+阅读 · 2021年1月17日

Pre-trained Models for Natural Language Processing: A Survey

Arxiv

113+阅读 · 2020年3月18日

ALBERT: A Lite BERT for Self-supervised Learning of Language Representations

Arxiv

11+阅读 · 2019年10月30日

Deep Learning for Generic Object Detection: A Survey

Deep Learning for Generic Object Detection: A Survey

Arxiv

14+阅读 · 2018年9月6日

大家都在搜

CMU博士论文

无人机集群

软件无线电

国防科技创新

无人机航拍交通事故现场勘查处置系统——行业第一的警用事故处理软件

微信扫码咨询专知VIP会员