Image colourisation is an ill-posed problem, with multiple correct solutions which depend on the context and object instances present in the input datum. Previous approaches attacked the problem either by requiring intense user interactions or by exploiting the ability of convolutional neural networks (CNNs) in learning image level (context) features. However, obtaining human hints is not always feasible and CNNs alone are not able to learn object-level semantics unless multiple models pretrained with supervision are considered. In this work, we propose a single network, named UCapsNet, that separate image-level features obtained through convolutions and object-level features captured by means of capsules. Then, by skip connections over different layers, we enforce collaboration between such disentangling factors to produce high quality and plausible image colourisation. We pose the problem as a classification task that can be addressed by a fully self-supervised approach, thus requires no human effort. Experimental results on three benchmark datasets show that our approach outperforms existing methods on standard quality metrics and achieves a state of the art performances on image colourisation. A large scale user study shows that our method is preferred over existing solutions.


翻译:图像颜色化是一个错误的问题, 多重正确的解决方案取决于输入数据中存在的上下文和对象实例。 以前的方法通过要求用户进行密集互动或利用神经神经网络(CNNs)在学习图像水平( context)特征方面的能力来应对问题。 然而, 获取人类提示并不总是可行的, 光有CNN无法单独学习目标层次的语义, 除非考虑多个经过监督培训的模型。 在这项工作中, 我们提出一个名为 UCapsNet 的单一网络, 它将通过聚合和通过胶囊捕捉到的物体级别特征获得不同的图像级别特征。 然后, 通过跳过不同层的连接, 我们强制在这种分解因素之间开展协作, 以产生高质量的和可信的图像颜色化。 我们作为一个分类任务提出了问题, 可以通过完全自我监督的方法来解决, 因此不需要人的努力。 三个基准数据集的实验结果显示, 我们的方法在标准质量指标上优于现有的方法, 并且实现了艺术表现在图像颜色化方面的状态。 大比例用户研究表明, 我们的方法是现有的方法。

0
下载
关闭预览

相关内容

IFIP TC13 Conference on Human-Computer Interaction是人机交互领域的研究者和实践者展示其工作的重要平台。多年来,这些会议吸引了来自几个国家和文化的研究人员。官网链接:http://interact2019.org/
专知会员服务
61+阅读 · 2020年3月19日
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
无人机视觉挑战赛 | ICCV 2019 Workshop—VisDrone2019
PaperWeekly
7+阅读 · 2019年5月5日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
条件GAN重大改进!cGANs with Projection Discriminator
CreateAMind
8+阅读 · 2018年2月7日
Deep Co-Training for Semi-Supervised Image Segmentation
Pluralistic Image Completion
Arxiv
8+阅读 · 2019年3月11日
VIP会员
相关VIP内容
专知会员服务
61+阅读 · 2020年3月19日
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
Top
微信扫码咨询专知VIP会员