Error-bounded lossy compression is a critical technique for significantly reducing scientific data volumes. With ever-emerging heterogeneous HPC architecture, GPU-accelerated error-bounded compressors (such as cuSZ and cuZFP) have been developed. However, they suffer from either low performance or low compression ratios. To this end, we propose cuSZ(x) to target both high compression ratio and throughput. We identify that data sparsity and data smoothness are key factors for high compression throughput. Our key contributions in this work are fourfold: (1) We propose an efficient compression workflow to adaptively perform run-length encoding and/or variable-length encoding. (2) We derive Lorenzo reconstruction in decompression as multidimensional partial-sum computation and propose a fine-grained Lorenzo reconstruction algorithm for GPU architectures. (3) We carefully optimize each of cuSZ's kernels by leveraging state-of-the-art CUDA parallel primitives. (4) We evaluate cuSZ(x) using seven real-world HPC application datasets on V100 and A100 GPUs. Experiments show cuSZ(x) improves the compression performance and ratios by up to 18.4$\times$ and 5.3$\times$, respectively, over cuSZ on the tested datasets.


翻译:与错误相关的损失压缩是大量减少科学数据数量的关键技术。 在不断出现不同的高压聚苯乙烯结构中,已经开发出GPU加速错误压缩器(如 cuSZ 和 cuZFP ) 。 但是,它们有低性能或低压缩率。 为此,我们提议 cuSZ(x) 以高压缩率和吞吐量为目标。 我们确认数据宽度和数据光滑度是高压缩通过量的关键因素。 我们在这方面的主要贡献有四重:(1) 我们提出高效压缩工作流程,以适应性地运行运行长编码和/或变长编码。 (2) 我们以多维部分和计算的方式将洛伦佐的减压重建推算成多维度部分和低压缩率。 但是我们提出微细度的洛伦佐的重建算法,以高压缩比率为目标。 (3) 我们通过利用州级的CUDA平行原始数据来仔细优化每个库。 (4) 我们用七套真实的HPC应用数据集来评估CUSZ 。

0
下载
关闭预览

相关内容

【干货书】机器学习速查手册,135页pdf
专知会员服务
125+阅读 · 2020年11月20日
Python分布式计算,171页pdf,Distributed Computing with Python
专知会员服务
107+阅读 · 2020年5月3日
专知会员服务
160+阅读 · 2020年1月16日
计算机 | 中低难度国际会议信息8条
Call4Papers
9+阅读 · 2019年6月19日
CCF推荐 | 国际会议信息10条
Call4Papers
8+阅读 · 2019年5月27日
CCF A类 | 顶级会议RTSS 2019诚邀稿件
Call4Papers
10+阅读 · 2019年4月17日
已删除
将门创投
3+阅读 · 2019年4月12日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
计算机 | CCF推荐会议信息10条
Call4Papers
5+阅读 · 2018年10月18日
CCF B类期刊IPM专刊截稿信息1条
Call4Papers
3+阅读 · 2018年10月11日
Arxiv
0+阅读 · 2021年7月19日
Arxiv
0+阅读 · 2021年7月17日
Arxiv
3+阅读 · 2018年3月13日
Arxiv
3+阅读 · 2017年10月1日
VIP会员
相关VIP内容
【干货书】机器学习速查手册,135页pdf
专知会员服务
125+阅读 · 2020年11月20日
Python分布式计算,171页pdf,Distributed Computing with Python
专知会员服务
107+阅读 · 2020年5月3日
专知会员服务
160+阅读 · 2020年1月16日
相关资讯
计算机 | 中低难度国际会议信息8条
Call4Papers
9+阅读 · 2019年6月19日
CCF推荐 | 国际会议信息10条
Call4Papers
8+阅读 · 2019年5月27日
CCF A类 | 顶级会议RTSS 2019诚邀稿件
Call4Papers
10+阅读 · 2019年4月17日
已删除
将门创投
3+阅读 · 2019年4月12日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
计算机 | CCF推荐会议信息10条
Call4Papers
5+阅读 · 2018年10月18日
CCF B类期刊IPM专刊截稿信息1条
Call4Papers
3+阅读 · 2018年10月11日
Top
微信扫码咨询专知VIP会员