雷锋网 AI 研习社按,CVPR 2018 图像压缩挑战赛(CLIC)结果已经出炉,腾讯音视频实验室和武汉大学陈震中教授联合团队于该项挑战赛上取得压缩性能第一。(腾讯音视频实验室凭借在 CLIC 中 PSNR 指标第一在雷锋网学术频道 AI 科技评论旗下数据库项目「AI 影响因子」中增加 10 分。)
CVPR 是计算机视觉领域的盛宴,全世界相关领域的顶尖学者、研究人员和企业都会积极参与。今年,CVPR 新增了图像压缩 workshop 和挑战赛议程,这场挑战赛由 Google、Twitter、Amazon 等公司联合赞助,是第一个由计算机视觉领域的会议发起的图像压缩挑战赛,旨在将神经网络、深度学习等一些新的方式引入到图像压缩领域。
图像压缩技术对于互联网信息传输有至关重要的意义。一张未经压缩的 1200 万像素的图片就会占用 36MB 的存储空间,而目前网络上每天图片传输、存储数量数以亿万计,为了节省带宽资源、存储资源,减少服务器的压力,高效的图像压缩算法必不可少。
据大会官方介绍,此次挑战赛分别从 PSNR 和主观评价两个方面去评估参赛团队的表现。峰值信噪比(PSNR)衡量的是压缩前后两张图逐像素统计所产生的误差,峰值信噪比越高,代表两张图误差越小,也就意味着压缩后的图与原图越接近、图片质量损失越小。
腾讯音视频实验室和武汉大学陈震中教授联合团队 iipTiramisu 在 PSNR(Peak Signal-to-Noise Ratio,峰值信噪比)指标上占据领先优势,在决赛数据集上比第二名高了 0.13 dB,位列第一。
据陈震中教授介绍,iipTiramisu 团队使用了基于传统混合框架(hybrid image coder)融入深度学习的编码模块 CNNMC 以及 CNN in-loop filter,以及基于不确定性的资源分配策略,最终可以在数据集压缩性能上比 BPG 提升 30% 以上。
从下图可以看到,与业界最优秀的开源图像压缩算法之一 BPG 相比,iipTiramisu 在峰值信噪比上有显著的优势:
Fig.1 The Rate-PSNR curve of different encoders. (bit-rate range 0.05-0.35 bpp)
信噪比不变的情况下,在性能优先模式下 iipTiramisu 比 BPG 节省 30.8% 的码率,速度优先模式下比 BPG 节省 27.9% 的码率。
Fig.2 Compressed by BPG, bit rate:0.14 bpp, PNSR:31.45 dB.
Fig.3 Compressed by iipTiramisu, bit rate:0.14 bpp, PNSR:33.03 dB
在码率都为 0.14 bpp 的情况下,iipTiramisu 的峰值信噪比比 BPG 高 1.58 dB,质量损失率明显减少。
关于该比赛的更多信息,可参见如下地址:
http://www.compression.cc/challenge/