B站开源了动漫画质修复模型！超分辨率无杂线无伪影！二次元狂喜！ - 专知

会员服务 ·

0

B站开源了动漫画质修复模型！超分辨率无杂线无伪影！二次元狂喜！

2022 年 2 月 2 日 CVer

点击下方卡片，关注“CVer”公众号

AI/CV重磅干货，第一时间送达

丰色发自凹非寺
转载自：量子位（QbitAI）

为了让你能高清重温童年的XXX，AI近来没少努力。

最近我们就发现了一个专为动漫图像而生的画质修复模型：

Real-CUGAN。

这个开源模型在今天登上了GitHub热榜，还来自b站官方。

它的效果也比此前俩个挺火的超分模型要更进一步，推理速度、兼容性什么的也都更快、更好。

“老二刺猿”了就是说[狗头]。

结构魔改自Waiuf2x

Real-CUGAN，全名Real Cascade U-Nets for Anime Image Super Resolution。

其结构魔改自此前大火的图片无损放大/降噪神器——Waiuf2x （GitHub标星23k），并可以与之无缝兼容；训练代码基本来自腾讯去年刚出品的RealESRGAN （GitHub标星9.1k）。

Waiuf2x出自日本的一位“技术宅”，原理大概就是把一堆二次元图片缩小再和原图放一起，通过算法让模型自己学会了如何放大拉伸图片。

Waiuf2x有免费的网页版供大家使用。

RealESRGAN，主要通过模拟高分辨率图像变低分辩率过程中的各种“退化”过程，然后让模型看到一张糊图后倒推出来它的高清图。

它是对超分“前辈”ESRGAN的进一步改进，后者曾赢得ECCV2018 PIRM-SR挑战赛中的第一名。

相比这两位，Real-CUGAN都有什么独到之处呢？

首先在训练集方面，前两者都是采用私有二次元训练集，量级与质量未知，Real-CUGAN则用了百万级高清的二次元数据集。

在推理耗时方面（目标为1080P），如果以Waiuf2x为基线，RealESRGAN要耗费2.2x的时间，Real-CUGAN则只需1x。

在强度调整方面，Waiuf2x可以支持多种降噪强度，RealESRGAN没法调整，Real-CUGAN则支持4种降噪强度与保守修复，未来还会提供不同程序的去模糊、去JPEG伪影、锐化等功能。

此外，Waiuf2x只能实现1倍和2倍分辨率修复，RealESRGAN只支持4倍，Real-CUGAN则2～4倍都可以（1倍还在训练中）。

当然，最最最重要的还是效果。

来看一些最直观的对比图：

可以看到，Real-CUGAN和Waiuf2x的结果都差不多，但是RealESRGAN却没有处理好地板纹理。

在这组对比图中，Waiuf2x明显不如后两者线条清晰，而相比Real-CUGAN，RealESRGAN中人物嘴巴和下颚处的线条是虚的，有杂线。

而在这组“极致渣清型”图片的超分效果中，Waiuf2x仍然明显不够清晰。

而RealESRGAN整体清晰是清晰，却仍然出现了杂线，以及和明显的伪影——只有Real-CUGAN画面干干净净，表现最好。

面向4类玩家提供不同参数配置

为了方便更多的创造者，Real-CUGAN面向4类群体开源了不同的推理参数设置。

Windows 玩家

Real-CUGAN为Windows用户打包了一个可执行环境（下载链接可在文末的仓库里自取）。

通过congfig文件可进行通用参数设置：在mode中填写video或者image决定超视频还是超图像。

模型分三类，具体选哪种也给了参考：

Waifu2x-caffe玩家

提供了两套参数：Real-CUGAN2x标准版(denoise-level3) 和Real-CUGAN2x无切割线版。

Python玩家

需torch>=1.0.0，配备numpy、opencv-python、moviepy模块。

VapourSynth玩家（专业视频压制）

这个就不细说了，相应的读者可以参见仓库的Readme说明～

最后，Real-CUGAN也正在计划更新更多：包括快速模型、简单的GUI、一步超到任意指定分辨率功能以及对本身效果的改进（优化纹理保留，削减模型处理痕迹）。

心动的朋友可以戳下方链接试试手：
https://github.com/bilibili/ailab/tree/main/Real-CUGAN

上面的动漫画质修复神器下载

后台回复：动漫画质修复，即可下载代码

ICCV和CVPR 2021论文和代码下载

后台回复：CVPR2021，即可下载CVPR 2021论文和代码开源的论文合集

后台回复：ICCV2021，即可下载ICCV 2021论文和代码开源的论文合集

后台回复：Transformer综述，即可下载最新的3篇Transformer综述PDF

CVer-Transformer交流群成立

扫码添加CVer助手，可申请加入CVer-Transformer 微信交流群，方向已涵盖：目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch和TensorFlow等群。

一定要备注：研究方向+地点+学校/公司+昵称（如Transformer+上海+上交+卡卡），根据格式备注，可更快被通过且邀请进群

▲长按加小助手微信，进交流群

▲点击上方卡片，关注CVer公众号

整理不易，请点赞和在看

登录查看更多

1

相关内容

ICCV2021 RealVSR: 业界首个移动端真实场景视频超分数据集

专知会员服务

24+阅读 · 2021年9月28日

【CVPR2021】GAN人脸预训练模型

【CVPR2021】GAN人脸预训练模型

专知会员服务

24+阅读 · 2021年4月10日

【CVPR2020-Facebook AI】单样本自适应域脸生成，One-Shot Domain Adaptation

【CVPR2020-Facebook AI】单样本自适应域脸生成，One-Shot Domain Adaptation

专知会员服务

29+阅读 · 2020年4月6日

【CVPR2020】用于图像超分辨率的深度展开网络，Deep Unfolding Network for Image Super-Resolution

【CVPR2020】用于图像超分辨率的深度展开网络，Deep Unfolding Network for Image Super-Resolution

专知会员服务

44+阅读 · 2020年3月26日

姿势服装随心换-CVPR2019

姿势服装随心换-CVPR2019

专知会员服务

36+阅读 · 2020年1月26日

腾讯老照片修复算法开源，细节到头发丝，3种预训练模型可下载 | GitHub热榜

腾讯老照片修复算法开源，细节到头发丝，3种预训练模型可下载 | GitHub热榜

量子位

1+阅读 · 2022年3月13日

1.5K star量，上古老番变4K，B站开源超分辨率算法

1.5K star量，上古老番变4K，B站开源超分辨率算法

机器之心

0+阅读 · 2022年2月15日

B站开源动漫画质修复模型，超分辨率无杂线无伪影，还是二次元最懂二次元

B站开源动漫画质修复模型，超分辨率无杂线无伪影，还是二次元最懂二次元

量子位

0+阅读 · 2022年2月2日

低清视频也能快速转高清：超分辨率算法TecoGAN

低清视频也能快速转高清：超分辨率算法TecoGAN

极市平台

14+阅读 · 2019年5月4日

ESRGAN：基于GAN的增强超分辨率方法（附代码解析）

ESRGAN：基于GAN的增强超分辨率方法（附代码解析）

PaperWeekly

18+阅读 · 2019年1月18日

恶劣气候环境下的图像复原技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

多约束协同的彩色夜视影像亚像素超分辨率重建

国家自然科学基金

1+阅读 · 2015年12月31日

基于局部纹理特征的图像细节超分辨率技术研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于变分结构纹理分解的超分辨率图像复原方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于三维差时投影法的超分辨率车辆重建算法研究

国家自然科学基金

0+阅读 · 2010年12月31日

Dual-Domain Image Synthesis using Segmentation-Guided GAN

Arxiv

0+阅读 · 2022年4月19日

Time Domain Adversarial Voice Conversion for ADD 2022

Arxiv

0+阅读 · 2022年4月19日

Semi-Supervised Super-Resolution

Arxiv

0+阅读 · 2022年4月18日

VoiceFixer: A Unified Framework for High-Fidelity Speech Restoration

Arxiv

0+阅读 · 2022年4月17日

GAN Inversion: A Survey

Arxiv

19+阅读 · 2021年1月14日

VIP会员

相关主题

相关VIP内容

ICCV2021 RealVSR: 业界首个移动端真实场景视频超分数据集

专知会员服务

24+阅读 · 2021年9月28日

【CVPR2021】GAN人脸预训练模型

【CVPR2021】GAN人脸预训练模型

专知会员服务

24+阅读 · 2021年4月10日

【CVPR2020-Facebook AI】单样本自适应域脸生成，One-Shot Domain Adaptation

【CVPR2020-Facebook AI】单样本自适应域脸生成，One-Shot Domain Adaptation

专知会员服务

29+阅读 · 2020年4月6日

【CVPR2020】用于图像超分辨率的深度展开网络，Deep Unfolding Network for Image Super-Resolution

【CVPR2020】用于图像超分辨率的深度展开网络，Deep Unfolding Network for Image Super-Resolution

专知会员服务

44+阅读 · 2020年3月26日

姿势服装随心换-CVPR2019

姿势服装随心换-CVPR2019

专知会员服务

36+阅读 · 2020年1月26日

热门VIP内容

开通专知VIP会员享更多权益服务

【ACML2025教程】迈向鲁棒且可信的大语言模型：问题与缓解策略

《利用人工智能改善军事警察行动：当下现状探索》最新95页报告

Google《AI智能体企业应用手册报告》，46页pdf

面向现代武装力量的高级AI驱动军事模拟与训练软件

相关资讯

腾讯老照片修复算法开源，细节到头发丝，3种预训练模型可下载 | GitHub热榜

腾讯老照片修复算法开源，细节到头发丝，3种预训练模型可下载 | GitHub热榜

量子位

1+阅读 · 2022年3月13日

1.5K star量，上古老番变4K，B站开源超分辨率算法

1.5K star量，上古老番变4K，B站开源超分辨率算法

机器之心

0+阅读 · 2022年2月15日

B站开源动漫画质修复模型，超分辨率无杂线无伪影，还是二次元最懂二次元

B站开源动漫画质修复模型，超分辨率无杂线无伪影，还是二次元最懂二次元

量子位

0+阅读 · 2022年2月2日

低清视频也能快速转高清：超分辨率算法TecoGAN

低清视频也能快速转高清：超分辨率算法TecoGAN

极市平台

14+阅读 · 2019年5月4日

ESRGAN：基于GAN的增强超分辨率方法（附代码解析）

ESRGAN：基于GAN的增强超分辨率方法（附代码解析）

PaperWeekly

18+阅读 · 2019年1月18日

相关基金

恶劣气候环境下的图像复原技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

多约束协同的彩色夜视影像亚像素超分辨率重建

国家自然科学基金

1+阅读 · 2015年12月31日

基于局部纹理特征的图像细节超分辨率技术研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于变分结构纹理分解的超分辨率图像复原方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于三维差时投影法的超分辨率车辆重建算法研究

国家自然科学基金

0+阅读 · 2010年12月31日

相关论文

Dual-Domain Image Synthesis using Segmentation-Guided GAN

Arxiv

0+阅读 · 2022年4月19日

Time Domain Adversarial Voice Conversion for ADD 2022

Arxiv

0+阅读 · 2022年4月19日

Semi-Supervised Super-Resolution

Arxiv

0+阅读 · 2022年4月18日

VoiceFixer: A Unified Framework for High-Fidelity Speech Restoration

Arxiv

0+阅读 · 2022年4月17日

GAN Inversion: A Survey

Arxiv

19+阅读 · 2021年1月14日

大家都在搜

蓝牙安全攻防

大型语言模型

分布式事务

比特币教程

沥青混合料配合比

滴滴司机调度系统实践

微信扫码咨询专知VIP会员