业界 | 《硅谷》里神乎其神的压缩技术，AI正在一点点做出来

会员服务 ·

业界 | 《硅谷》里神乎其神的压缩技术，AI正在一点点做出来

2018 年 1 月 7 日 AI科技评论 脑极体

AI 科技评论按：本文首发于公众号脑极体，AI 科技评论授权转载。

好剧总是追的特别快，比如说我们熟悉的黄暴神剧《硅谷》，今年该迎来第五季了。

这部剧里让人印象深刻的东西很多，而剧里几个主角发明的创业神器、号称能改变世界命运的“魔笛手”绝对是其中之一。

给没看过这部剧的朋友介绍一下，所谓的“魔笛手”是剧中主角发明的压缩算法。本来这个东西是他们用来打造音乐网站的，结果后来这个技术被证明可以把文件无损压缩到极小，并且速度极快，从而引出了令人无法直视的各种剧情。

据说在写剧本之初，主创人员曾经想过写一种什么技术，能让观众马上懂得其意义，又跟真正的技术世界比较贴合。最终他们发现，压缩是最好的选择。因为差不多每个人都知道文件越小越好，如果主角搞出来一个能让数据无限存储的东西，那当然就赚大了。

事实上，人类跟数据的无损压缩这件事，已经硬杠了几十年。成熟的压缩技术，已经通过互联网变成了大多数人的日常用品。但尽管如此，压缩这件事始终没有走到终点，《硅谷》里那种神一样的压缩技术，依旧是我们渴望而不可及的。

但在今天，人工智能开始把压缩这件事放在自己的任务栏里，并且一步步对《硅谷》里的“魔笛手”发起挑战。

折腾了半个世纪的无损压缩

我们日常在对压缩的主要需求，被称为无损压缩。它可以将文件变小，然后再通过某种方式还原出来正常使用。虽然今天这听起来很普通，但其实人类已经为它折腾了50多年。

当然，发现数据应该压缩后再进行传输和存储，是更早之前的事情。从19世纪的摩斯电码时代人类就已经发现了，很多数据中的无效部分是可以被归类和省略的，从而可以换取更快的传输速度和更少的存储空间。

这可以说是一种符号世界里的常识，比如说一个人跟另一个人说“老地方见”，那么就意味着他们把这句话中的地址信息在彼此都了解的情况下进行了压缩，从而缩短了讲话时间。

类似道理的压缩技术很早就应用在计算机世界，在大型机当道的时候其价值已经被证明。但真正压缩开始流行，还是在互联网飞黄腾达之后。

1977年，是无损压缩这件事跨时代的一个年份。这一年，以色列海法理工学院的科学家Abraham Lempel 和 Jacob Ziv联合发表了一种压缩算法，以两人名字共同命名为LZ算法。这一年发布的技术被称为LZ77。第二年，两人又发布了改进版的LZ78。此后所有无损数据压缩技术，差不多都是从这两种演化而来。

另一个无损压缩的时代，开始在八十年代末。

这个时候，随着互联网开始腾飞，各种商业压缩软件已经成熟，但还缺少能独大的那一家。

当时流行的压缩软件叫做Arc，后来一个名叫Phil Katz的年轻人突发奇想之下，希望能够做个更好的版本。于是，这个之后被称为互联网天才和第一代极客的大牛做了名字充满挑衅意味的PKArc。结果1988年，Phil Katz被告侵犯商标和知识产权。于是第二年他又做了新的修改版，用了新的IMPLODE算法，也就是我们今天无比熟悉的ZIP。