漫画汉化组,不用手动抹掉原文了:开源AI一键擦除,还能修复背景

2019 年 8 月 22 日 CVer

点击上方“CVer”,选择加"星标"或“置顶”

重磅干货,第一时间送达

栗子 发自 凹非寺 
本文转载自:量子位(QbitAI)

 来自《弹丸论破》

漫画汉化组,和动画字幕组,表面看都是翻译,可工作还是很不一样的。

比如,日文动画生肉一般没有加字幕,而漫画原本就充满了文字。

所以,漫画的汉化组,要先把原文抹掉,才能贴上中文。

需要抹掉的,不只气泡里的对话,还有背景里的旁白,以及字体硕大雄健的拟声词。

这样巨大的工作量,还是交给AI吧,只要一键:

满篇的文字都消失了,人类完全没有帮忙。

AI的名字叫SickZil-Machine,是一群韩国小伙伴开发的,已经开源。

不光字去掉了,背景也修补了:

有了它,汉化组再也不用大规模手动擦除了。

面对此情此景,人类表示相见恨晚:

那么,韩国少年们是怎样孕育出这只AI的?

一步两步

团队说,这是一个完全自动消除漫画文字的AI;但如果人类需要,也可以手动指定消除某一部分文字。

至于是如何擦掉文字,AI由两个机器学习模型组成

一个叫SegNet,负责把需要抹掉的文字部分,分割出来;

一个叫ComplNet,负责把抹掉之后露出的背景补全。

抠出文字的SegNet,借鉴了前辈U-Net图像分割技术:

U-Net结构像个U,从全卷积网络 (FCN) 改进而来。

分割是用成对数据训练的。这里的成对数据,就是漫画原图,加上文字部分的mask。

只用了285对数据。

抠出文字之后,就该填补背景的ComplNet上场了。它是借鉴了前辈DeepFillv2图像修复算法:

DeepFillv2来自UIUC和Adobe,擦除图像的任意部位,AI都能修补完整。

比如,抹掉一盏路灯,AI便会把路灯背后的建筑物补好。

除此之外,还能按自己的意志修改图片:

把人类的下巴擦掉,再描个短一点的下巴,AI就会给你一张不是马脸的人像了。

当然,漫画未必需要这样高度定制,脑补背景就够。

团队用了31,497张图来训练,其中11,464张是有文字的。

最终,成果斐然:

不过,也不一定要全靠AI,人类可以手动选择要 (或不要) 消除的部分。

先让屏幕显示出AI生成的mask (红色) 。如果发现不该变红的部分红了,就手动把这一部分从mask里去掉,这样AI就不会把它消除了。

比如上面,妹子的脸旁边,没有字的地方红了一大块。那么,把这一部分红色框起来扔掉,就好了。

你也试试吧

其实,这个好东西也不一定是汉化组才用得到。

没事做的时候,把漫画原本的台词抹掉,练习填词,也是很健康的活动哟。

比如到了这种时候,人类会说些什么呢:

来自山下智博

额,哪里健康了?

传送门:
https://github.com/KUR-creative/SickZil-Machine

U-Net传送门:
https://arxiv.org/abs/1505.04597

Deepfillv2传送门:
http://jiahuiyu.com/deepfill2/

作者系网易新闻·网易号“各有态度”签约作者

重磅!CVer学术交流群成立啦


扫码添加CVer助手,可申请加入CVer-目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测和模型剪枝&压缩等群。一定要备注:研究方向+地点+学校/公司+昵称(如目标检测+上海+上交+卡卡)

▲长按加群


▲长按关注我们

麻烦给我一个在看

登录查看更多
2

相关内容

人工智能杂志AI(Artificial Intelligence)是目前公认的发表该领域最新研究成果的主要国际论坛。该期刊欢迎有关AI广泛方面的论文,这些论文构成了整个领域的进步,也欢迎介绍人工智能应用的论文,但重点应该放在新的和新颖的人工智能方法如何提高应用领域的性能,而不是介绍传统人工智能方法的另一个应用。关于应用的论文应该描述一个原则性的解决方案,强调其新颖性,并对正在开发的人工智能技术进行深入的评估。 官网地址:http://dblp.uni-trier.de/db/journals/ai/
一图搞定ML!2020版机器学习技术路线图,35页ppt
专知会员服务
92+阅读 · 2020年7月28日
【CVPR2020-北京大学】自适应间隔损失的提升小样本学习
专知会员服务
81+阅读 · 2020年6月9日
华为发布《自动驾驶网络解决方案白皮书》
专知会员服务
122+阅读 · 2020年5月22日
【CVPR2020-Facebook AI】前置不变表示的自监督学习
专知会员服务
46+阅读 · 2020年4月19日
神经网络的拓扑结构,TOPOLOGY OF DEEP NEURAL NETWORKS
专知会员服务
30+阅读 · 2020年4月15日
【芝加哥大学】可变形的风格转移,Deformable Style Transfer
专知会员服务
30+阅读 · 2020年3月26日
【电子书】Flutter实战305页PDF免费下载
专知会员服务
20+阅读 · 2019年11月7日
告别 PS !3 行代码 5 秒搞定抠图的 AI 神器!
程序人生
6+阅读 · 2019年7月11日
旧照片着色修复神器!自注意力GAN效果惊艳
GAN生成式对抗网络
7+阅读 · 2018年11月3日
抠图不再麻烦,Adobe 新算法让 P 图以假乱真
AI研习社
6+阅读 · 2018年5月28日
Neural Module Networks for Reasoning over Text
Arxiv
9+阅读 · 2019年12月10日
Geometric Graph Convolutional Neural Networks
Arxiv
10+阅读 · 2019年9月11日
Arxiv
11+阅读 · 2019年6月19日
Mesh R-CNN
Arxiv
4+阅读 · 2019年6月6日
Panoptic Feature Pyramid Networks
Arxiv
3+阅读 · 2019年1月8日
Neural Architecture Optimization
Arxiv
8+阅读 · 2018年9月5日
Auto-Context R-CNN
Arxiv
4+阅读 · 2018年7月8日
VIP会员
相关VIP内容
一图搞定ML!2020版机器学习技术路线图,35页ppt
专知会员服务
92+阅读 · 2020年7月28日
【CVPR2020-北京大学】自适应间隔损失的提升小样本学习
专知会员服务
81+阅读 · 2020年6月9日
华为发布《自动驾驶网络解决方案白皮书》
专知会员服务
122+阅读 · 2020年5月22日
【CVPR2020-Facebook AI】前置不变表示的自监督学习
专知会员服务
46+阅读 · 2020年4月19日
神经网络的拓扑结构,TOPOLOGY OF DEEP NEURAL NETWORKS
专知会员服务
30+阅读 · 2020年4月15日
【芝加哥大学】可变形的风格转移,Deformable Style Transfer
专知会员服务
30+阅读 · 2020年3月26日
【电子书】Flutter实战305页PDF免费下载
专知会员服务
20+阅读 · 2019年11月7日
相关论文
Neural Module Networks for Reasoning over Text
Arxiv
9+阅读 · 2019年12月10日
Geometric Graph Convolutional Neural Networks
Arxiv
10+阅读 · 2019年9月11日
Arxiv
11+阅读 · 2019年6月19日
Mesh R-CNN
Arxiv
4+阅读 · 2019年6月6日
Panoptic Feature Pyramid Networks
Arxiv
3+阅读 · 2019年1月8日
Neural Architecture Optimization
Arxiv
8+阅读 · 2018年9月5日
Auto-Context R-CNN
Arxiv
4+阅读 · 2018年7月8日
Top
微信扫码咨询专知VIP会员