图像压缩算法是图像处理领域中媒体传输和压缩的基础。在其诞生的几十年后,诸如JPEG图像编解码器等算法仍然是行业标准。在压缩领域,一个值得注意的研究课题是深度学习(DL)。本文探讨了理想图像压缩和物体检测(OD)应用的DL模型的优化。
要优化的DL模型是基于一个现有的压缩框架,即CONNECT模型。这个框架将传统的JPEG图像编解码器包裹在两个卷积神经网络(CNNs)中。第一个网络,ComCNN,专注于将输入的图像压缩成一个紧凑的表示,以输入到图像编解码器。第二个网络,RecCNN,着重于从编解码器中重建输出图像,使之与原始图像尽可能相似。为了提高CONNECT模型的性能,一个名为Optuna的优化软件包裹了该框架。从每个CNN中选择超参数,由Optuna进行评估和优化。一旦CONNECT模型产生了理想的结果,输出的图像就被应用于YOLOv5 OD网络。
本文探讨了DL超参数对图像质量和压缩指标的影响。此外,检测网络将为图像压缩对计算机视觉应用的影响提供背景。