We propose a trainable Image Signal Processing (ISP) framework that produces DSLR quality images given RAW images captured by a smartphone. To address the color misalignments between training image pairs, we employ a color-conditional ISP network and optimize a novel parametric color mapping between each input RAW and reference DSLR image. During inference, we predict the target color image by designing a color prediction network with efficient Global Context Transformer modules. The latter effectively leverage global information to learn consistent color and tone mappings. We further propose a robust masked aligned loss to identify and discard regions with inaccurate motion estimation during training. Lastly, we introduce the ISP in the Wild (ISPW) dataset, consisting of weakly paired phone RAW and DSLR sRGB images. We extensively evaluate our method, setting a new state-of-the-art on two datasets.
翻译:我们提议了一个经过培训的图像信号处理框架, 生成由智能手机拍摄的 RAW 图像的 DSLR 质量图像。 为了解决培训图像配对之间的颜色不匹配问题, 我们使用一个彩色条件的 ISP 网络, 并优化每个输入的 RAW 和 参考 DSLR 图像之间的新型光学色彩映射。 在推断中, 我们通过设计一个配有高效的 Global Economic 变换器模块的彩色预测网络来预测目标颜色图像。 后者有效地利用全球信息来学习一致的颜色和音调映。 我们进一步提议一个强大的掩码匹配损失来识别和丢弃在培训期间动作估计不准确的区域。 最后, 我们将ISP 引入野生数据集, 由微弱配对的 RAW 和 DSLRR SRRGB 图像组成。 我们广泛评估了我们的方法, 在两个数据集上设置新的艺术状态 。