视觉底层任务优秀开源工作：BasicSR 库使用方法

会员服务 ·

视觉底层任务优秀开源工作：BasicSR 库使用方法

2022 年 2 月 26 日 极市平台

↑ 点击蓝字关注极市平台

作者丨科技猛兽

编辑丨极市平台

极市导读

本文整理自 BasicSR 原作者的关于 BasicSR 库的文档介绍，github 介绍以及相关知乎讲解，旨在对 BasicSR 库的特性和使用方法做一次汇总和梳理。>>加入极市CV技术交流群，走在计算机视觉的最前沿

1 什么是 BasicSR 库

BasicSR 是全称 Basic Super-Resolution 的缩写，它是一个基于 PyTorch 的开源图像视频复原工具箱 (Open-Source Image and Video Restoration Toolbox)。它适配多种视觉底层任务，比如超分辨率，去噪，去模糊，去 JPEG 压缩噪声等。旨在将各种 Super Restoration 模型整合在一起，形成一个复现视觉底层任务模型结果的统一框架。

作者：Xintao Wang，博士毕业于香港中文大学信息工程专业。主要研究计算机底层视觉，特别是图像和视频的超分辨率。曾在 NTIRE, PIRM 等国际超分辨率比赛中多次获得冠军，提出了具有影响力的 ESRGAN，EDVR 等工作。Google Scholar 引用2900余次。目前专注于研究迈向实际应用的图像和视频的复原与增强。首先致敬大佬！

本文整理自 BasicSR 原作者的关于 BasicSR 库的文档介绍，github 介绍以及相关知乎讲解，旨在对 BasicSR 库的特性和使用方法做一次汇总和梳理，算是个引子。更多关于 1. BasicSR 代码解读，2. 如何使用，3. 作者的个人经验等等的更多内容也欢迎大家参考作者的官方指南~ (持续更新)。

作者个人主页：https://xinntao.github.io/

作者 github 链接：https://github.com/xinntao

BasicSR 库链接：https://github.com/xinntao/BasicSR

Gitee码云地址：https://gitee.com/xinntao/BasicSR

作者官方指南：https://www.zhihu.com/column/c_1295528110138163200

BasicSR 库提供了一套非常全面的图像/视频复原的代码框架。因为在实际问题中，超分往往是不会单独出现的，它往往是和去噪，去模糊，去压缩等复杂的降质 (降低质量) 的过程一起存在的。从这一点来看，BasicSR 提供了一个很棒的分布式训练和评估的代码框架，方便后人开发。更难能可贵的是它还在不断地更新迭代新的训练方法，新的复原模型和优化代码。

并且，除了上面的 BasicSR 库的链接，作者还专门撰写了 BasicSR 库的训练示例的 github，帮助新手更方便地了解和使用 BasicSR 库。

https://github.com/xinntao/BasicSR-examples

BasicSR 库的目标：

按照作者的讲述，BasicSR 是为了方便研究者的。因此之前很多写法，设计都是以方便做实验来做的。作者平时是使用 BasicSR 来开发新算法，做实验的，因此会把自己觉得好用的，便捷的设计放进去。这些改动也都是经过自己试验的，每个改动都会有个来由，为解决某个小问题而改动的。

作者现在依旧做着图像和视频的复原工作，而且会朝着实际应用的方向走。加上他平时也用 BasicSR 来开发，因此这个代码库的发展路径会不可避免地受到作者研究的关注点的影响。作者会将自己正在使用的，复现的，尝试的一些代码逐渐 merge到 BasicSR 里面。

总之，BasicSR 一方面以研究者为中心，另一方面会提供方便用户使用的脚本和说明文档，朝着 AdvancedSR 的目标前进。

2 安装 BasicSR

有两种方式安装 BasicSR。

如果你想研究 BasicSR 的细节或者开发它以满足你的需求，建议选择方案一。
如果你只是想把 BasicSR 作为一个包使用，建议选择方案二。

第一种安装方式是先把 BasicSR 代码 local clone，就是下载到本地的方式安装：

克隆代码：

git clone https://github.com/xinntao/BasicSR.git

安装依赖库：

cd BasicSR
pip install -r requirements.txt

安装 BasicSR：在 BasicSR 根目录下执行以下命令以安装 BasicSR：

情况1：不需要 C++ extensions：

python setup.py develop

情况2：需要 JIT mode 的 C++ extensions，且在安装过程中不需要编译它们：

python setup.py develop

情况3：在安装过程中需要编译 C++ extensions：

BASICSR_EXT=True python setup.py develop

情况3.5：如果还需要指定 CUDA 路径：

CUDA_HOME=/usr/local/cuda \
CUDNN_INCLUDE_DIR=/usr/local/cuda \
CUDNN_LIB_DIR=/usr/local/cuda \
BASICSR_EXT=True python setup.py develop

第二种安装方式是把 BasicSR 当作一个额外的 python package - basicsr，即可以通过 pip 安装：

情况1：不需要 C++ extensions：

pip install basicsr

情况2：需要 JIT mode 的 C++ extensions，且在安装过程中不需要编译它们：

pip install basicsr

情况3：在安装过程中需要编译 C++ extensions：

BASICSR_EXT=True pip install basicsr

如果遇到运行错误，如 ImportError: cannot import name 'deform_conv_ext' | 'fused_act_ext' | 'upfirdn2d_ext'，你可以通过重新安装检查编译过程。下面的命令将打印详细的日志。

BASICSR_EXT=True pip install basicsr -vvv

情况3.5：如果还需要指定 CUDA 路径：

CUDA_HOME=/usr/local/cuda \
CUDNN_INCLUDE_DIR=/usr/local/cuda \
CUDNN_LIB_DIR=/usr/local/cuda \
BASICSR_EXT=True pip install basicsr

一些 PyTorch C++ extensions 的使用：

deformable convolution:href="https://github.com/xinntao/BasicSR/blob/master/basicsr/ops">dcnfor EDVR (officialtorchvision.ops.deform_conv2dinstead)

StyleGAN customized operators:upfirdn2dandfused_actfor StyleGAN2

有2种方案：

compile the PyTorch C++ extensions during installation
OR load the PyTorch C++ extensions just-in-time (JIT)

可以根据需要选择合适的方案 (下面是这两种方案的优劣对比)：

如果你不需要使用 PyTorch C++ extensions，就跳过这一步，也不需要设置BASICSR_EXT或BASICSR_JIT环境变量。

3 如何使用 BasicSR 开发自己的项目

这里原作者给大家提供了一个使用 BasicSR 的教程，这一小节译自作者的 example 教程，包含的所有代码都在下面的链接里面：

当我们开发一个新的方法时，我们往往在改进: data, arch, model；而很多流程、基础的功能其实是共用的。那么，我们希望可以专注于主要功能的开发，而不要重复造轮子。BasicSR 能够把很多相似的功能都独立出来，我们只要关心 data, arch, model 的开发即可。

首先通过第二种安装方式安装 BasicSR：

pip install basicsr
git clone https://github.com/xinntao/BasicSR-examples.git
cd BasicSR-examples

接下来原作者通过一个简单的例子展示 BasicSR 如何使用：

训练集：BSDS100（ https%3A//github.com/xinntao/BasicSR-examples/releases/download/0.0.0/BSDS100.zip）
验证集：Set5（ https%3A//github.com/xinntao/BasicSR-examples/releases/download/0.0.0/Set5.zip）

下载这些数据集：

python scripts/prepare_example_data.py

示例数据下载完以后在 datasets/example 文件夹中。

原作者的这个示例使用的是一个超分任务，它以低分辨率图像为输入，输出高分辨率图像。低分辨率图像包含：1) CV2 X4 降采样。2) JPEG压缩 (quality=70)。

原作者这里的网络架构使用一个类似 SRCNN 的网络结构，并且在训练中同时使用 L1 和 L2 (MSE) 损失。这个示例分以下几步来完成：

① data

首先原作者的例子里面写了一个新的data/example_dataset.py。实现一个 dataset 一般需要以下几步。

读取 Ground-Truth (GT) 图像。BasicSR 提供了 FileClient 这个功能来从文件夹中方便地读取 LMDB 文件和 meta_info txt。在这个例子中，作者使用了 folder mode。
合成低分辨率的图像。通过 __getitem__(self, index) 这个函数我们能够轻易完成数据读取的流程，比如说 downsampling 或者加 JPEG compression。更多的基本操作在 [basicsr/data/degradations], [basicsr/data/tranforms] ，和 [basicsr/data/data_util] 里面。
把图片转化成 PyTorch 的 tensor 类型并返回。

有两点需要注意：

在 ExampleDataset之前加上 @DATASET_REGISTRY.register() 。
新的 dataset 在命名时要以 _dataset.py为结尾，比如 example_dataset.py，这样程序能够自动 import 这个类。

在 option 里面加上：

datasets:
  train:  # training dataset
    name: ExampleBSDS100
    type: ExampleDataset  # the class name

    # ----- the followings are the arguments of ExampleDataset ----- #
    dataroot_gt: datasets/example/BSDS100
    io_backend:
      type: disk

    gt_size: 128
    use_flip: true
    use_rot: true

    # ----- arguments of data loader ----- #
    use_shuffle: true
    num_worker_per_gpu: 3
    batch_size_per_gpu: 16
    dataset_enlarge_ratio: 10
    prefetch_mode: ~

  val:  # validation dataset
    name: ExampleSet5
    type: ExampleDataset
    dataroot_gt: datasets/example/Set5
    io_backend:
      type: disk

② arch

原作者的例子里面写了一个新的archs/example_arch.py。

有两点需要注意：

在 ExampleArch之前加上 @ARCH_REGISTRY.register()。
新的 arch 在命名时要以 _arch.py为结尾，比如 example_arch.py，这样程序能够自动 import 这个类。

在 option 里面加上：

# network structures
network_g:
  type: ExampleArch  # the class name

  # ----- the followings are the arguments of ExampleArch ----- #
  num_in_ch: 3
  num_out_ch: 3
  num_feat: 64
  upscale: 4

③ model

原作者的例子里面写了一个新的models/example_model.py，包含模型的训练过程。

在这个文件中，通过 SRModel import 模型。许多模型都有类似的操作，所以你可以从 basicsr/models 继承和修改。
损失函数使用 L1 and L2 (MSE) loss。
其他内容，如 setup_optimizers, validation, save是从 SRModel 里面 import 的。

有两点需要注意：

在 ExampleModel之前加上 @MODEL_REGISTRY.register()。
新的 model 在命名时要以 _model.py为结尾，比如 example_model.py，这样程序能够自动 import 这个类。

在 option 里面加上：

# training settings
train:
  optim_g:
    type: Adam
    lr: !!float 2e-4
    weight_decay: 0
    betas: [0.9, 0.99]

  scheduler:
    type: MultiStepLR
    milestones: [50000]
    gamma: 0.5

  total_iter: 100000
  warmup_iter: -1  # no warm up

  # ----- the followings are the configurations for two losses ----- #
  # losses
  l1_opt:
    type: L1Loss
    loss_weight: 1.0
    reduction: mean

  l2_opt:
    type: MSELoss
    loss_weight: 1.0
    reduction: mean

④ training pipeline

整体的 training pipeline 可以复用 BasicSR库的 basicsr/train.py。基于它，train.py 文件可以非常简洁：

import os.path as osp

import archs  # noqa: F401
import data  # noqa: F401
import models  # noqa: F401
from basicsr.train import train_pipeline

if __name__ == '__main__':
    root_path = osp.abspath(osp.join(__file__, osp.pardir))
    train_pipeline(root_path)

以上四步就写完了 example_option.yml，接下来开始运行：

⑤ debug 模式

运行命令：

python train.py -opt options/example_option.yml --debug

⑥ normal training

运行命令：

python train.py -opt options/example_option.yml

如果训练过程被意外中断，需要恢复。请在命令中使用 --auto_resume。

python train.py -opt options/example_option.yml --auto_resume

到目前为止，你已经完成了使用 BasicSR 开发自己的项目。

最后要强调的是，本文只是对 BasicSR 库的一个简单介绍，算是个引子。更多关于 1. BasicSR 代码解读，2. 如何使用，3. 作者的个人经验等等的更多内容也欢迎大家参考作者的官方指南~ (持续更新)。

参考：

https://zhuanlan.zhihu.com/p/261223409

https://github.com/xinntao/BasicSR-examples

https://github.com/xinntao/BasicSR

公众号后台回复“数据集”获取30+深度学习数据集下载～

△点击卡片关注极市平台，获取最新CV干货

极市干货

数据集资源汇总： 10个开源工业检测数据集汇总｜ 21个深度学习开源数据集分类汇总

算法trick ：目标检测比赛中的tricks集锦｜从39个kaggle竞赛中总结出来的图像分割的Tips和Tricks

技术综述：一文弄懂各种loss function ｜工业图像异常检测最新研究总结（2019-2020）

# 极市平台签约作者#

科技猛兽

知乎：科技猛兽

清华大学自动化系19级硕士

研究领域：AI边缘计算 (Efficient AI with Tiny Resource)：专注模型压缩，搜索，量化，加速，加法网络，以及它们与其他任务的结合，更好地服务于端侧设备。

作品精选

搞懂 Vision Transformer 原理和代码，看这篇技术综述就够了

用Pytorch轻松实现28个视觉Transformer，开源库 timm 了解一下！（附代码解读）

轻量高效！清华智能计算实验室开源基于PyTorch的视频 (图片) 去模糊框架SimDeblur

投稿方式：

添加小编微信Fengcall（微信号：fengcall19），备注：姓名-投稿

△长按添加极市平台小编

觉得有用麻烦给个在看啦~

登录查看更多

相关内容

ICSR

关注 0

ICSR是软件和系统重用研究与技术领域的首场盛会。ICSR的主要目标是介绍软件和系统重用领域的最新进展和突破，并促进研究人员和实践者之间的密集和持续交流。官网链接：https://www.uc.edu/eventservices/ICSR2019.html

【CVPR2022】 Dropout在图像超分任务中的重煥新生

专知会员服务

19+阅读 · 2022年3月5日

【CVPR 2022】使用多模态Transformer的端到端视频对象分割，End-to-End Referring Video Object Segmentation with Multimodal Transformer

专知会员服务

28+阅读 · 2022年3月3日

港中文《深度学习单图像超分辨率》综述论文

专知会员服务

41+阅读 · 2021年9月30日

【ICML2021】通过文本生成统一视觉和语言任务

专知会员服务

19+阅读 · 2021年9月13日

近期必读的5篇顶会ICCV 2021【语义分割】相关论文和代码

专知会员服务

43+阅读 · 2021年8月20日

ICCV'21 Oral｜拒绝调参，显著提点！检测分割任务的新损失函数RS Loss开源

专知会员服务

16+阅读 · 2021年8月11日

【CVPR2021教程】深度学习中的归一化技术:方法、分析和应用

专知会员服务

42+阅读 · 2021年6月21日

【CVPR2021】基于跨任务场景结构知识迁移的单张深度图像超分辨率方法

专知会员服务

18+阅读 · 2021年3月23日

【UIUC】最新《深度学习3D点云理解》综述论文，20页pdf

专知会员服务

30+阅读 · 2020年9月21日

CVPR 2020 论文开源项目合集

专知会员服务

110+阅读 · 2020年3月12日

CVPR 2022 | 刷新low-level视觉多项第一！Restormer：图像复原又一力作！

CVer

13+阅读 · 2022年3月13日

视觉底层任务优秀开源工作：MMEditing 库使用方法

极市平台

12+阅读 · 2022年3月9日

CVPR 2022 NTIRE 双目图像超分辨率挑战赛正式启动！

CVer

0+阅读 · 2022年1月29日

CVPR NTIRE 2022｜双目超分辨率挑战赛开赛

极市平台

0+阅读 · 2022年1月24日

OpenMMLab开源首个基于深度学习算法的光流估计工具箱

极市平台

0+阅读 · 2021年11月18日

【速览】ACM MM 2021 | 针对场景文本图像超分辨率任务的并行上下文注意力网络

中国图象图形学学会CSIG

0+阅读 · 2021年11月5日

ICCV 2021 | 新的去雪数据集CSD开源

极市平台

0+阅读 · 2021年10月22日

Github库分享：超全的PyTorch学习资源汇总

专知

21+阅读 · 2019年5月9日

CVPR2019| 04-18更新13篇论文及代码（2篇oral，含跟踪、分类、图像压缩等）

极市平台

28+阅读 · 2019年4月18日

CVPR2017 VQA 任务冠军：基于双向注意力机制视觉问答pyTorch实现

专知

48+阅读 · 2017年12月24日

视觉媒体的结构感知处理与分析模型研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于压缩感知的图像盲恢复模型和算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

人眼对比度敏感视觉特性的测量及其在图像压缩技术中的应用研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于可分凸优化的图像分解和波前重建的模型与算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于多生理参数的飞行员在任务环境中对视觉刺激的响应机理研究

国家自然科学基金

3+阅读 · 2013年12月31日

云环境中基于三维世界模型的图像表示与压缩

国家自然科学基金

2+阅读 · 2013年12月31日

视觉注意的计算模型及其应用

国家自然科学基金

0+阅读 · 2012年12月31日

基于深度学习和感知计算的图像质量评价

国家自然科学基金

3+阅读 · 2012年12月31日

基于感知视觉单词描述的对象分割研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于目标区域演化分割的图像描述研究

国家自然科学基金

0+阅读 · 2008年12月31日

NTIRE 2022 Challenge on Stereo Image Super-Resolution: Methods and Results

Arxiv

0+阅读 · 2022年4月20日

Multifidelity Deep Operator Networks

Arxiv

0+阅读 · 2022年4月19日

Structured and Unstructured Teams for Research Software Development at the Netherlands eScience Center

Arxiv

0+阅读 · 2022年4月19日

NAFSSR: Stereo Image Super-Resolution Using NAFNet

Arxiv

0+阅读 · 2022年4月19日

Image Data Augmentation for Deep Learning: A Survey

Arxiv

2+阅读 · 2022年4月19日

VoiceFixer: A Unified Framework for High-Fidelity Speech Restoration

Arxiv

0+阅读 · 2022年4月17日

Transfer Learning for Instance Segmentation of Waste Bottles using Mask R-CNN Algorithm

Arxiv

0+阅读 · 2022年4月15日

Attention Mechanisms in Computer Vision: A Survey

Arxiv

58+阅读 · 2021年11月15日

Meta-Learning with Dynamic-Memory-Based Prototypical Network for Few-Shot Event Detection

Arxiv

20+阅读 · 2019年10月25日

Deep Learning for Sentiment Analysis : A Survey

Arxiv

25+阅读 · 2018年1月24日

VIP会员