Top-K SpMV is a key component of similarity-search on sparse embeddings. This sparse workload does not perform well on general-purpose NUMA systems that employ traditional caching strategies. Instead, modern FPGA accelerator cards have a few tricks up their sleeve. We introduce a Top-K SpMV FPGA design that leverages reduced precision and a novel packet-wise CSR matrix compression, enabling custom data layouts and delivering bandwidth efficiency often unreachable even in architectures with higher peak bandwidth. With HBM-based boards, we are 100x faster than a multi-threaded CPU implementation and 2x faster than a GPU with 20% higher bandwidth, with 14.2x higher power-efficiency.


翻译:顶KSpMV是稀薄嵌入层的类似搜索的关键组成部分。 这种稀薄的工作量在采用传统缓冲策略的通用NUMA系统上表现不佳。 相反,现代的FPGA加速器卡的袖子里有一些技巧。 我们引入了顶K SpMV FPGA设计,利用了降低精确度和新颖的包式CSR矩阵压缩,使定制数据布局和带宽效率即使在高峰宽带宽的建筑中也常常无法达到。 在基于 HBM 的板块上,我们比多轨CPU执行速度快100x,比高20%带宽的GPU速度2x快,高14.2x功率。

0
下载
关闭预览

相关内容

小米在预训练模型的探索与优化
专知会员服务
18+阅读 · 2020年12月31日
一份简单《图神经网络》教程,28页ppt
专知会员服务
123+阅读 · 2020年8月2日
Python图像处理,366页pdf,Image Operators Image Processing in Python
【Manning新书】现代Java实战,592页pdf
专知会员服务
99+阅读 · 2020年5月22日
专知会员服务
60+阅读 · 2020年3月19日
深度神经网络模型压缩与加速综述
专知会员服务
128+阅读 · 2019年10月12日
Windows 提权-快速查找 Exp
黑白之道
3+阅读 · 2019年1月23日
Ray RLlib: Scalable 降龙十八掌
CreateAMind
9+阅读 · 2018年12月28日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
神经网络学习率设置
机器学习研究会
4+阅读 · 2018年3月3日
前端高性能计算(4):GPU加速计算
前端大全
7+阅读 · 2017年10月26日
【学习】(Python)SVM数据分类
机器学习研究会
6+阅读 · 2017年10月15日
【推荐】全卷积语义分割综述
机器学习研究会
19+阅读 · 2017年8月31日
使用 MPI for Python 并行化遗传算法
Python开发者
5+阅读 · 2017年8月4日
强化学习 cartpole_a3c
CreateAMind
9+阅读 · 2017年7月21日
已删除
将门创投
7+阅读 · 2017年7月11日
VIP会员
相关资讯
Windows 提权-快速查找 Exp
黑白之道
3+阅读 · 2019年1月23日
Ray RLlib: Scalable 降龙十八掌
CreateAMind
9+阅读 · 2018年12月28日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
神经网络学习率设置
机器学习研究会
4+阅读 · 2018年3月3日
前端高性能计算(4):GPU加速计算
前端大全
7+阅读 · 2017年10月26日
【学习】(Python)SVM数据分类
机器学习研究会
6+阅读 · 2017年10月15日
【推荐】全卷积语义分割综述
机器学习研究会
19+阅读 · 2017年8月31日
使用 MPI for Python 并行化遗传算法
Python开发者
5+阅读 · 2017年8月4日
强化学习 cartpole_a3c
CreateAMind
9+阅读 · 2017年7月21日
已删除
将门创投
7+阅读 · 2017年7月11日
Top
微信扫码咨询专知VIP会员