为什么有些画面让你终生难忘?GAN来告诉你原因

2019 年 11 月 8 日 量子位
十三 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

GAN又做了件了不起的事。

提到达芬奇的《蒙娜丽莎》,那张神秘的微笑立即浮现脑海。

提到梵高的《星月夜》,那片迷幻的夜空也仿佛历历在目。

上:《蒙娜丽莎》;下:《星月夜》

我们深知一张图片胜过千言万语,但到底为什么那些著名的画作即使很久没再看过,也能让人如此印象深刻呢?

或许你了解其中原理,但现在有一个更简单粗暴且直观的方法:

问问AI,让GAN给你模拟一个过程

这个神奇的技术叫GANalyze,来自麻省理工学院(MIT)。


什么是GANalyze

简单来说,GANalyze就是一个使用生成模型来研究认知特性的框架

认知特性可以包括记忆力、美学或者情感效价等。

MIT电气工程和计算机科学助理教授Phillip Isola说:

关于记忆性的文章有很多,但是这种方法可以让我们想象出什么是记忆性。

它为我们提供了一个难以用语言表达的视觉定义。

这项研究是建立在MemNet基础之上。简单来说,MemNet这个模型会对图像的可记忆性进行评级,并且还能强调图像中的哪些特征会对决策产生影响。

而GANalyze使用了GAN技术,在一张图像从“无人问津”到“印象深刻”的过程中,将其可视化

量子位根据在线测试工具实验了一波,结果如下:

我们可以看到一个在竹林中较为模糊的熊猫,逐渐转变为特点鲜明的熊猫:黑色的眼睛、耳朵、爪子,和它白色的部分形成鲜明对比。

这个GAN有三个部分组成:

assesor(评估器):基于MemNet,打开目标图像的记忆旋钮,并计算如何达到预期的效果;
transfomer(转换器):执行指令;
generator(生成器):输出最终的图像。

来看下这张汉堡变得令人印象深刻的过程:

从左至右的变化不禁让小编想起一句著名Rap:你看这个汉堡它又大又圆~

研究人员利用GANalyze在生成图像的过程中,详细的展示了让图像或场景脱颖而出的因素。

被试者记忆最深刻的图像具有以下特点:

· 具有明亮的颜色
· 背景简单
· 处于画面突出的中心位置

研究的合著者Lore Goetschalckx表示:

人类的大脑在进化过程中最关注这些特征,而这正是GAN所注意到的。

但最具美感的图像并不是最让人印象深刻的。

GitHub代码

这么有意思的项目当然已经在GitHub上开源:
https://github.com/LoreGoetschalckx/GANalyze

研究人员提供了Tensorflow和Pytorch实现。也通过下面的途径正式测试过:

PyTorch >= 0.4 (1.1.0) 和 torchvision >= 0.2.2 (0.3.0)
Tensorflow 1.12.0 和tensorflow_hub 0.1.1 (针对预训练过的BigGANs)
numpy, scipy, PIL

研究人员建议参考本地文档来获得更详细的安装说明。但是,如果是在Ubuntu的linux服务器上,以下命令可能就足够了:

# Tensorflow 1.12 with GPU support (highly recommended)
pip install tensorflow-gpu==1.12
# Tensorflow hub (for pretrained BigGAN modules)
pip install tensorflow_hub==0.1.1

# PyTorch and torchvision with latest version of cuda toolkit.
Note: Anaconda is the recommended package manager for PyTorch.
conda install pytorch torchvision cudatoolkit=10.0 -c pytorch

要clone这个repo,可以运行如下代码:

git clone https://github.com/LoreGoetschalckx/GANalyze.git
cd GANalyze

可以首先下载GANalyze项目页面上托管的预训练的generator和assesor。

也提供了用于下载Tensorflow或PyTorch模型的实用程序脚本,可以使用以下命令进行调用:

TensorFlow:

cd tensorflow; sh download_pretrained.sh

Pytorch:

cd pytorch; sh download_pretrained.sh

训练代码如下:

python train_tf.py \
 --generator_arch biggan --generator_model biggan256 \
 --assessor memnet \
 --transformer OneDirection None \
 --train_alpha_a -0.5 --train_alpha_b 0.5 \
 --gpu_id 0 --num_samples 400000 --checkpoint_resume 0

测试代码如下:

python test_tf.py \
--alpha 0.1 --test_truncation 1 \
--checkpoint_dir checkpoints/biggan__biggan256/memnet/OneDirection_None/<commit_hash> \
--checkpoint 400000 \
--gpu_id 0

One More Thing

其实,GANalyze除了上述功能外,研究人员发现它还有很多潜在的应用价值。

例如,可以通过增强现实系统中的对象来检测甚至治疗失忆

还可以通过创建令人难忘的图形,帮助读者记住信息,这可能会给教育带来革命性的变化

那么,你觉得这样的GAN技术还能为我们带来怎样的福利呢?

传送门

博客:
http://news.mit.edu/2019/what-makes-an-image-memorable-ask-computer-1101

论文:
http://ganalyze.csail.mit.edu

GitHub:
https://github.com/LoreGoetschalckx/GANalyze

问卷福利!人工智能行业白皮书即将发布

量子位&IDC中国将联合发布「2019中国人工智能行业白皮书」,并于12月6日MEET大会重磅发布,特请小伙伴们填写一下问卷,谢谢大家支持~

填写福利:发布后第一时间获得白皮书,AI内参、大会观众票3折优惠券。 点击下图即可填写问卷、领取问卷福利:

榜单征集!三大奖项,锁定AI Top玩家

2019中国人工智能年度评选启幕,将评选领航企业、商业突破人物、最具创新力产品3大奖项,并于MEET 2020大会揭榜,欢迎优秀的AI公司扫码报名!

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 !

登录查看更多
0

相关内容

GAN:生成性对抗网,深度学习模型的一种,在神经网络模型中引入竞争机制,非常流行。
最新《Deepfakes:创造与检测》2020综述论文,36页pdf
专知会员服务
62+阅读 · 2020年5月15日
【CVPR2020】MSG-GAN:用于稳定图像合成的多尺度梯度GAN
专知会员服务
28+阅读 · 2020年4月6日
必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码
专知会员服务
32+阅读 · 2020年1月10日
【书籍】深度学习框架:PyTorch入门与实践(附代码)
专知会员服务
163+阅读 · 2019年10月28日
GANs最新综述论文: 生成式对抗网络及其变种如何有用
专知会员服务
70+阅读 · 2019年10月19日
GAN 为什么需要如此多的噪声?
AI科技评论
14+阅读 · 2020年3月17日
还在脑补画面?这款GAN能把故事画出来
机器之心
5+阅读 · 2019年7月6日
GAN 真的创造了新的信息吗?
GAN生成式对抗网络
5+阅读 · 2019年5月24日
这么多年,终于知道为啥右指针不能往回走了
九章算法
5+阅读 · 2019年4月15日
为什么说GAN很快就要替代现有摄影技术了?
GAN生成式对抗网络
5+阅读 · 2019年3月12日
2018年有意思的几篇GAN论文
专知
21+阅读 · 2019年1月5日
生成式对抗网络(GAN)如何快速理解?
炼数成金订阅号
4+阅读 · 2018年1月9日
为什么大家都不戳破深度学习的本质?
36大数据
4+阅读 · 2017年12月7日
Arxiv
8+阅读 · 2018年5月21日
Arxiv
5+阅读 · 2018年5月1日
Arxiv
4+阅读 · 2018年4月10日
Arxiv
11+阅读 · 2018年3月23日
VIP会员
相关资讯
GAN 为什么需要如此多的噪声?
AI科技评论
14+阅读 · 2020年3月17日
还在脑补画面?这款GAN能把故事画出来
机器之心
5+阅读 · 2019年7月6日
GAN 真的创造了新的信息吗?
GAN生成式对抗网络
5+阅读 · 2019年5月24日
这么多年,终于知道为啥右指针不能往回走了
九章算法
5+阅读 · 2019年4月15日
为什么说GAN很快就要替代现有摄影技术了?
GAN生成式对抗网络
5+阅读 · 2019年3月12日
2018年有意思的几篇GAN论文
专知
21+阅读 · 2019年1月5日
生成式对抗网络(GAN)如何快速理解?
炼数成金订阅号
4+阅读 · 2018年1月9日
为什么大家都不戳破深度学习的本质?
36大数据
4+阅读 · 2017年12月7日
Top
微信扫码咨询专知VIP会员