Many data compressors regularly encode probability distributions for entropy coding - requiring minimal description length type of optimizations. Canonical prefix/Huffman coding usually just writes lengths of bit sequences, this way approximating probabilities with powers-of-2. Operating on more accurate probabilities usually allows for better compression ratios, and is possible e.g. using arithmetic coding and Asymmetric Numeral Systems family. Especially the multiplication-free tabled variant of the latter (tANS) builds automaton often replacing Huffman coding due to better compression at similar computational cost - e.g. in popular Facebook Zstandard and Apple LZFSE compressors. There is discussed encoding of probability distributions for such applications, especially using Pyramid Vector Quantizer(PVQ)-based approach with deformation, also tuned symbol spread for tANS.


翻译:许多数据压缩器定期编码对加密编码的概率分布 - 需要最短描述的优化类型。 Canonical priix/Huffman 编码通常只是写出比特序列的长度, 以这种方式接近2号功率的概率。 在更精确的概率情况下操作通常可以改善压缩比率, 并且有可能使用数学编码和亚称数字系统等方法。 特别是后者的免乘变式( tANS) 建立自动成像, 通常取代赫夫曼的编码, 原因是以类似的计算成本压缩更好---- 例如在流行的Facebook Zstand 和 苹果 LZFSE 压缩器中。 讨论过这些应用的概率分布的编码, 特别是使用基于子体的变形的矢量器( PVQ) 方法, 以及调控件的符号 。

0
下载
关闭预览

相关内容

【图与几何深度学习】Graph and geometric deep learning,49页ppt
【干货书】机器学习速查手册,135页pdf
专知会员服务
125+阅读 · 2020年11月20日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
78+阅读 · 2020年7月26日
Python分布式计算,171页pdf,Distributed Computing with Python
专知会员服务
107+阅读 · 2020年5月3日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
59+阅读 · 2019年10月17日
已删除
将门创投
6+阅读 · 2019年4月10日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
Arxiv
19+阅读 · 2020年7月13日
Arxiv
3+阅读 · 2018年10月18日
VIP会员
相关VIP内容
相关资讯
已删除
将门创投
6+阅读 · 2019年4月10日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
Top
微信扫码咨询专知VIP会员