Michael Anderson,Benny Chen,Stephen Chen,Summer Deng,Jordan Fix,Michael Gschwind,Aravind Kalaiah,Changkyu Kim,Jaewon Lee,Jason Liang,Haixin Liu,Yinghai Lu,Jack Montgomery,Arun Moorthy,Satish Nadathur,Sam Naghshineh,Avinash Nayak,Jongsoo Park,Chris Petersen,Martin Schatz,Narayanan Sundaram,Bangsheng Tang,Peter Tang,Amy Yang,Jiecao Yu,Hector Yuen,Ying Zhang,Aravind Anbudurai,Vandana Balan,Harsha Bojja,Joe Boyd,Matthew Breitbach,Claudio Caldato,Anna Calvo,Garret Catron,Sneh Chandwani,Panos Christeas,Brad Cottel,Brian Coutinho,Arun Dalli,Abhishek Dhanotia,Oniel Duncan,Roman Dzhabarov,Simon Elmir,Chunli Fu,Wenyin Fu,Michael Fulthorp,Adi Gangidi,Nick Gibson,Sean Gordon,Beatriz Padilla Hernandez,Daniel Ho,Yu-Cheng Huang,Olof Johansson,Shishir Juluri,Shobhit Kanaujia,Manali Kesarkar,Jonathan Killinger,Ben Kim,Rohan Kulkarni,Meghan Lele,Huayu Li,Huamin Li,Yueming Li,Cynthia Liu,Jerry Liu,Bert Maher,Chandra Mallipedi,Seema Mangla,Kiran Kumar Matam,Jubin Mehta,Shobhit Mehta,Christopher Mitchell,Bharath Muthiah,Nitin Nagarkatte,Ashwin Narasimha,Bernard Nguyen,Thiara Ortiz,Soumya Padmanabha,Deng Pan,Ashwin Poojary, Ye, Qi,Olivier Raginel,Dwarak Rajagopal,Tristan Rice,Craig Ross,Nadav Rotem,Scott Russ,Kushal Shah,Baohua Shan,Hao Shen,Pavan Shetty,Krish Skandakumaran,Kutta Srinivasan,Roshan Sumbaly,Michael Tauberg,Mor Tzur,Sidharth Verma,Hao Wang,Man Wang,Ben Wei,Alex Xia,Chenyu Xu,Martin Yang,Kai Zhang,Ruoxi Zhang,Ming Zhao,Whitney Zhao,Rui Zhu,Ajit Mathews,Lin Qiao,Misha Smelyanskiy,Bill Jia,Vijay Rao
Michael Anderson,Benny Chen,Stephen Chen,Summer Deng,Jordan Fix,Michael Gschwind,Aravind Kalaiah,Changkyu Kim,Jaewon Lee,Jason Liang,Haixin Liu,Yinghai Lu,Jack Montgomery,Arun Moorthy,Satish Nadathur,Sam Naghshineh,Avinash Nayak,Jongsoo Park,Chris Petersen,Martin Schatz,Narayanan Sundaram,Bangsheng Tang,Peter Tang,Amy Yang,Jiecao Yu,Hector Yuen,Ying Zhang,Aravind Anbudurai,Vandana Balan,Harsha Bojja,Joe Boyd,Matthew Breitbach,Claudio Caldato,Anna Calvo,Garret Catron,Sneh Chandwani,Panos Christeas,Brad Cottel,Brian Coutinho,Arun Dalli,Abhishek Dhanotia,Oniel Duncan,Roman Dzhabarov,Simon Elmir,Chunli Fu,Wenyin Fu,Michael Fulthorp,Adi Gangidi,Nick Gibson,Sean Gordon,Beatriz Padilla Hernandez,Daniel Ho,Yu-Cheng Huang,Olof Johansson,Shishir Juluri,Shobhit Kanaujia,Manali Kesarkar,Jonathan Killinger,Ben Kim,Rohan Kulkarni,Meghan Lele,Huayu Li,Huamin Li,Yueming Li,Cynthia Liu,Jerry Liu,Bert Maher,Chandra Mallipedi,Seema Mangla,Kiran Kumar Matam,Jubin Mehta,Shobhit Mehta,Christopher Mitchell,Bharath Muthiah,Nitin Nagarkatte,Ashwin Narasimha,Bernard Nguyen,Thiara Ortiz,Soumya Padmanabha,Deng Pan,Ashwin Poojary, Ye, Qi,Olivier Raginel,Dwarak Rajagopal,Tristan Rice,Craig Ross,Nadav Rotem,Scott Russ,Kushal Shah,Baohua Shan,Hao Shen,Pavan Shetty,Krish Skandakumaran,Kutta Srinivasan,Roshan Sumbaly,Michael Tauberg,Mor Tzur,Sidharth Verma,Hao Wang,Man Wang,Ben Wei,Alex Xia,Chenyu Xu,Martin Yang,Kai Zhang,Ruoxi Zhang,Ming Zhao,Whitney Zhao,Rui Zhu,Ajit Mathews,Lin Qiao,Misha Smelyanskiy,Bill Jia,Vijay Rao

In this paper, we provide a deep dive into the deployment of inference accelerators at Facebook. Many of our ML workloads have unique characteristics, such as sparse memory accesses, large model sizes, as well as high compute, memory and network bandwidth requirements. We co-designed a high-performance, energy-efficient inference accelerator platform based on these requirements. We describe the inference accelerator platform ecosystem we developed and deployed at Facebook: both hardware, through Open Compute Platform (OCP), and software framework and tooling, through Pytorch/Caffe2/Glow. A characteristic of this ecosystem from the start is its openness to enable a variety of AI accelerators from different vendors. This platform, with six low-power accelerator cards alongside a single-socket host CPU, allows us to serve models of high complexity that cannot be easily or efficiently run on CPUs. We describe various performance optimizations, at both platform and accelerator level, which enables this platform to serve production traffic at Facebook. We also share deployment challenges, lessons learned during performance optimization, as well as provide guidance for future inference hardware co-design.


翻译:在本文中,我们为在Facebook上部署推算加速器提供了深潜。 我们的许多 ML 工作量具有独特的特点, 如记忆存取量稀少、模型大小大以及计算、记忆和网络带宽要求高。 我们根据这些要求共同设计了一个高性能、节能的推算加速器平台。 我们描述了我们在Facebook上开发和部署的推论加速器生态系统: 通过开放计算平台(OCP)开发的硬件,以及通过Pytorch/Caffe2/Glow开发的软件框架和工具。 这种生态系统的特征从一开始就是开放性,让不同供应商能够使用各种AI加速器。 这个平台有6个低功率的加速器卡,以及一个单张主机主机的CPU, 允许我们提供无法在CPU上轻易或高效运行的高复杂性模型。 我们描述了平台和加速器级别上的各种性能优化,使这个平台能够为Facebook上的生产流量服务。 我们还分享了部署挑战,作为未来最佳操作过程中学到的硬件。

0
下载
关闭预览

相关内容

最新《神经架构搜索NAS》报告,附46页ppt与视频
专知会员服务
35+阅读 · 2020年12月30日
《神经架构搜索NAS》最新进展综述
专知会员服务
55+阅读 · 2020年8月12日
专知会员服务
60+阅读 · 2020年3月19日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
39+阅读 · 2019年10月9日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
Facebook PyText 在 Github 上开源了
AINLP
7+阅读 · 2018年12月14日
开发者应当了解的18套机器学习平台
深度学习世界
5+阅读 · 2018年8月14日
条件GAN重大改进!cGANs with Projection Discriminator
CreateAMind
8+阅读 · 2018年2月7日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
Adversarial Variational Bayes: Unifying VAE and GAN 代码
CreateAMind
7+阅读 · 2017年10月4日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Arxiv
28+阅读 · 2021年9月18日
Slimmable Generative Adversarial Networks
Arxiv
3+阅读 · 2020年12月10日
Arxiv
12+阅读 · 2020年12月10日
Arxiv
4+阅读 · 2020年3月27日
Arxiv
35+阅读 · 2019年11月7日
VIP会员
相关VIP内容
最新《神经架构搜索NAS》报告,附46页ppt与视频
专知会员服务
35+阅读 · 2020年12月30日
《神经架构搜索NAS》最新进展综述
专知会员服务
55+阅读 · 2020年8月12日
专知会员服务
60+阅读 · 2020年3月19日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
39+阅读 · 2019年10月9日
相关资讯
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
Facebook PyText 在 Github 上开源了
AINLP
7+阅读 · 2018年12月14日
开发者应当了解的18套机器学习平台
深度学习世界
5+阅读 · 2018年8月14日
条件GAN重大改进!cGANs with Projection Discriminator
CreateAMind
8+阅读 · 2018年2月7日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
Adversarial Variational Bayes: Unifying VAE and GAN 代码
CreateAMind
7+阅读 · 2017年10月4日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
相关论文
Top
微信扫码咨询专知VIP会员