会员服务 ·

0

50张图片做出李飞飞数万张的效果，类脑AI竟然这样玩？

2018 年 9 月 1 日 量子位

郭一璞发自凹非寺
量子位报道 | 公众号 QbitAI

这张毛色艳丽“星空猫”，在经过图像处理之前长这样：

没有了迷幻背景和油画般的毛色，顿时变成了三只“凡猫”。

一个不懂GAN也不会PS的普通人，完成这样的图像处理要几分钟？

在微信通讯录里锁定设计师大神……1分钟；

组织语言求大神帮忙……5分钟；

等大神回复……30分钟；

大神发来了他的报价……卒。

但是对马卡龙玩图的用户来说，只要点几下屏幕就够了。

上传原图，APP自动抠出三只猫；

把背景和猫的渲染风格都设置成星空；

降低猫的亮度，提高猫的对比度。

三步完成只有设计师才能做出的效果，依靠的是马卡龙玩图APP背后的类脑人工智能技术。

一家“沉迷”类脑的AI公司

马卡龙玩图APP之前的名字叫Versa，和背后的这家公司的名字一样。

作为一家专做“P图”的AI创业公司，Versa的研究方向和别家不同：

不做大数据人工智能，专做类脑人工智能。

Versa的CTO赵维杰向量子位介绍了他们的研究方向和特点。

类脑人工智能和基于大数据的人工智能不同，是机器学习的另一个分支，研究类脑计算，以及概念表示、迁移与生成，和脑科学的关系更近一些。

相比依赖大数据进行模型训练的神经网络，类脑人工智能可以实现和人类小孩认识世界类似的能力，仅仅通过少量数据就可以实现一些效果。

比如说，李飞飞2016年的ECCV论文《Perceptual Losses for Real-Time Style Transfer
and Super-Resolution》用到的方法，实现每种风格需要4~8万张图片来进行训练，而Versa的通过类脑人工智能进行风格迁移，每种风格只需要50张图片就可以了。

△ Gatys和李飞飞的风格迁移效果图

而概念迁移则是类脑人工智能的另一个优势。拿图片来举栗子，概念迁移是指可以将颜色、形状等基础概念，加上语义，拼接成复杂概念。

作为一家以P图为核心的公司，类脑人工智能便于实现概念迁移的特点也让Versa在“抠图”这个步骤中取得了优势，赵维杰自信满满的说他们的准确率超越了谷歌的Deeplab V3+大约5个百分点，达到了95.7%。

△ 抠出人物就可以换背景啦

类脑人工智能的第三个优势“无中生有”被Versa用在了姿态估计上。

通过单目摄像头拍摄出的景象，类脑人工智能“脑补”出景深，可以方便实现3D姿态估计。

类脑狂人赵维杰

说赵维杰是个类脑狂人一点也不为过。

目前，赵维杰不仅是Versa的CTO，还是Versa和上海交大的脑科学与人工智能联合实验室主任。

早在2012年，赵维杰就已经开始研究类脑人工智能方向了。

在他看来，依靠大数据的人工智能只能解决一小部分问题，比如图像识别等；而在更广阔的应用场景中，人们无法获得如此大量的数据，只能靠类脑人工智能来解决。

而类脑人工智能本身的概念迁移能力，更让研发的速度足够快。“任意一个基于脑科学的AI公司，都非常容易建立起长期的技术壁垒，”赵维杰说，“假设说现在我们的图像分割算法可能领先行业六个月的话，那我们下一个算法一定领先行业要一年。”

这也让赵维杰找到了自己的创业方向——不是安防、医疗这类基于大数据人工智能的偏B端生意，而是服务更多人、更加多元化的文化产业，通过便捷的图像处理，让不管是设计师还是普通人都可以享受到AI带来的方便和乐趣。

或许，这也是一个AI创业的灵感：谁说底层技术必须服务于B端？

赵维杰告诉量子位，目前Versa在APP端已经拥有1200万用户，未来准备继续在C端通过马卡龙玩图APP服务普通用户，在B端通过Adobe插件的形式，服务专业的设计师，让设计师们不再花大量时间精力用在简单的抠图上。

One More Thing

Versa给量子位展示了马卡龙玩图APP下一个版本即将上线的新功能，名叫inpainting，可以一键P掉照片里的人物。

注意“仙人洞”中的那个白衣女子。

不见了。

另外，他们还准备把“抠图”功能应用在视频里，比如把这样一段电影：

变成这样：

你觉得效果如何？

最后，读者朋友们对类脑人工智能怎么看？欢迎评论区留言。

— 完 —

加入社群

量子位AI社群19群开始招募啦，欢迎对AI感兴趣的同学，在量子位公众号（QbitAI）对话界面回复关键字“交流群”，获取入群方式；

此外，量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募，面向正在从事相关领域的工程师及研究人员。

进专业群请在量子位公众号（QbitAI）对话界面回复关键字“专业群”，获取入群方式。（专业群审核较严，敬请谅解）

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

登录查看更多

1

相关内容

玩图-全能手机P图神器。不但基础功能强大，而且还有画中画，拼立得等创新功能。

Yoshua Bengio最新《深度学习》MLSS2020教程，附104页PPT及视频

Yoshua Bengio最新《深度学习》MLSS2020教程，附104页PPT及视频

专知会员服务

134+阅读 · 2020年7月10日

【MIT-ICML2020】图神经网络的泛化与表示的局限

【MIT-ICML2020】图神经网络的泛化与表示的局限

专知会员服务

43+阅读 · 2020年6月23日

【CVPR2020-Tutorial】视觉的图网络结构表示学习，Google Chen Sun

【CVPR2020-Tutorial】视觉的图网络结构表示学习，Google Chen Sun

专知会员服务

43+阅读 · 2020年6月16日

斯坦福2020硬课《分布式算法与优化》

斯坦福2020硬课《分布式算法与优化》

专知会员服务

123+阅读 · 2020年5月6日

【ICASSP2020】分布式与高效深度学习，140页ppt详述深度学习压缩与联邦学习训练进展

【ICASSP2020】分布式与高效深度学习，140页ppt详述深度学习压缩与联邦学习训练进展

专知会员服务

126+阅读 · 2020年5月6日

【Google大脑】进化正则激活层，Evolving Normalization-Activation Layers

【Google大脑】进化正则激活层，Evolving Normalization-Activation Layers

专知会员服务

19+阅读 · 2020年4月9日

李飞飞经典CS231N-2020季开课了！斯坦福《卷积神经网络视觉识别》4月7号开始！不容错过！

李飞飞经典CS231N-2020季开课了！斯坦福《卷积神经网络视觉识别》4月7号开始！不容错过！

专知会员服务

61+阅读 · 2020年4月8日

【论文】结构GANs，Structured GANs，

【论文】结构GANs，Structured GANs，

专知会员服务

15+阅读 · 2020年1月16日

【ECML-PKDD 2019】突破可解释性障碍——解释深度图卷积模型的一种方法（Breaking the interpretability barrier - a methodfor interpreting deep graph convolutional models）

【ECML-PKDD 2019】突破可解释性障碍——解释深度图卷积模型的一种方法（Breaking the interpretability barrier - a methodfor interpreting deep graph convolutional models）

专知会员服务

19+阅读 · 2019年12月1日

【BAAI|2019】机器能被训练思考吗？我们怎么知道呢？也就是说，机器能被教会意识吗？，Donald B. Rubin（附pdf）

【BAAI|2019】机器能被训练思考吗？我们怎么知道呢？也就是说，机器能被教会意识吗？，Donald B. Rubin（附pdf）

专知会员服务

24+阅读 · 2019年11月21日

【学界】CVPR2019:好的模型，迁移学习效果就更好吗？Google Brain最新结论

【学界】CVPR2019:好的模型，迁移学习效果就更好吗？Google Brain最新结论

GAN生成式对抗网络

8+阅读 · 2019年6月12日

AI上色对比人工调色：结果令人难以置信

AI上色对比人工调色：结果令人难以置信

网易智能菌

8+阅读 · 2019年4月25日

草图秒变风景照，英伟达神笔马良GaoGAN终于开源了

草图秒变风景照，英伟达神笔马良GaoGAN终于开源了

新智元

14+阅读 · 2019年4月17日

照片上的人出来了！云从3D人体重建登顶三项榜单，一张照片就能生成3D形象

照片上的人出来了！云从3D人体重建登顶三项榜单，一张照片就能生成3D形象

量子位

4+阅读 · 2019年3月20日

还在PS里手动描边？AI自动抠图只需5秒

还在PS里手动描边？AI自动抠图只需5秒

机器之心

12+阅读 · 2018年12月19日

仅四年时间 AI生成的人脸已经能骗过你的眼睛

仅四年时间 AI生成的人脸已经能骗过你的眼睛

cnbeta资讯

4+阅读 · 2018年12月18日

AI学会了视觉推理，“脑补”看不清的物体 | 李佳李飞飞等的CVPR论文

AI学会了视觉推理，“脑补”看不清的物体 | 李佳李飞飞等的CVPR论文

量子位

6+阅读 · 2018年3月31日

NIPS 2017：与李飞飞、哈萨比斯、Ian Goodfellow等7位大牛面对面

NIPS 2017：与李飞飞、哈萨比斯、Ian Goodfellow等7位大牛面对面

新智元

3+阅读 · 2017年12月17日

从0到1，漫谈步态识别那些事

从0到1，漫谈步态识别那些事

机器学习研究会

10+阅读 · 2017年9月24日

新 iPhone 推出的人像光效功能让人惊叹，这都是它的功劳

新 iPhone 推出的人像光效功能让人惊叹，这都是它的功劳

少数派

3+阅读 · 2017年9月15日

CHIP: Channel-wise Disentangled Interpretation of Deep Convolutional Neural Networks

CHIP: Channel-wise Disentangled Interpretation of Deep Convolutional Neural Networks

Arxiv

5+阅读 · 2019年2月7日

Attend More Times for Image Captioning

Attend More Times for Image Captioning

Arxiv

6+阅读 · 2018年12月8日

ViZDoom Competitions: Playing Doom from Pixels

ViZDoom Competitions: Playing Doom from Pixels

Arxiv

5+阅读 · 2018年9月10日

Learning Blind Video Temporal Consistency

Learning Blind Video Temporal Consistency

Arxiv

3+阅读 · 2018年8月1日

Neural Network Interpretation via Fine Grained Textual Summarization

Arxiv

6+阅读 · 2018年5月23日

XGAN: Unsupervised Image-to-Image Translation for Many-to-Many Mappings

Arxiv

3+阅读 · 2018年4月25日

Low-Shot Learning from Imaginary Data

Arxiv

15+阅读 · 2018年4月3日

Improved Image Captioning via Policy Gradient optimization of SPIDEr

Arxiv

6+阅读 · 2018年3月12日

Deterministic Non-Autoregressive Neural Sequence Modeling by Iterative Refinement

Arxiv

4+阅读 · 2018年2月19日

DenseReg: Fully Convolutional Dense Shape Regression In-the-Wild

Arxiv

3+阅读 · 2018年2月1日

VIP会员

相关主题

相关VIP内容

Yoshua Bengio最新《深度学习》MLSS2020教程，附104页PPT及视频

Yoshua Bengio最新《深度学习》MLSS2020教程，附104页PPT及视频

专知会员服务

134+阅读 · 2020年7月10日

【MIT-ICML2020】图神经网络的泛化与表示的局限

【MIT-ICML2020】图神经网络的泛化与表示的局限

专知会员服务

43+阅读 · 2020年6月23日

【CVPR2020-Tutorial】视觉的图网络结构表示学习，Google Chen Sun

【CVPR2020-Tutorial】视觉的图网络结构表示学习，Google Chen Sun

专知会员服务

43+阅读 · 2020年6月16日

斯坦福2020硬课《分布式算法与优化》

斯坦福2020硬课《分布式算法与优化》

专知会员服务

123+阅读 · 2020年5月6日

【ICASSP2020】分布式与高效深度学习，140页ppt详述深度学习压缩与联邦学习训练进展

【ICASSP2020】分布式与高效深度学习，140页ppt详述深度学习压缩与联邦学习训练进展

专知会员服务

126+阅读 · 2020年5月6日

【Google大脑】进化正则激活层，Evolving Normalization-Activation Layers

【Google大脑】进化正则激活层，Evolving Normalization-Activation Layers

专知会员服务

19+阅读 · 2020年4月9日

李飞飞经典CS231N-2020季开课了！斯坦福《卷积神经网络视觉识别》4月7号开始！不容错过！

李飞飞经典CS231N-2020季开课了！斯坦福《卷积神经网络视觉识别》4月7号开始！不容错过！

专知会员服务

61+阅读 · 2020年4月8日

【论文】结构GANs，Structured GANs，

【论文】结构GANs，Structured GANs，

专知会员服务

15+阅读 · 2020年1月16日

【ECML-PKDD 2019】突破可解释性障碍——解释深度图卷积模型的一种方法（Breaking the interpretability barrier - a methodfor interpreting deep graph convolutional models）

【ECML-PKDD 2019】突破可解释性障碍——解释深度图卷积模型的一种方法（Breaking the interpretability barrier - a methodfor interpreting deep graph convolutional models）

专知会员服务

19+阅读 · 2019年12月1日

【BAAI|2019】机器能被训练思考吗？我们怎么知道呢？也就是说，机器能被教会意识吗？，Donald B. Rubin（附pdf）

【BAAI|2019】机器能被训练思考吗？我们怎么知道呢？也就是说，机器能被教会意识吗？，Donald B. Rubin（附pdf）

专知会员服务

24+阅读 · 2019年11月21日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】多目标奖励与偏好优化：理论与算法

《无形的防御者？将定向能武器集成到反无人机框架的机遇与挑战》报告

自主化海军：海上无人系统与未来海战

迈向智能体系统规模化的科学

相关资讯

【学界】CVPR2019:好的模型，迁移学习效果就更好吗？Google Brain最新结论

【学界】CVPR2019:好的模型，迁移学习效果就更好吗？Google Brain最新结论

GAN生成式对抗网络

8+阅读 · 2019年6月12日

AI上色对比人工调色：结果令人难以置信

AI上色对比人工调色：结果令人难以置信

网易智能菌

8+阅读 · 2019年4月25日

草图秒变风景照，英伟达神笔马良GaoGAN终于开源了

草图秒变风景照，英伟达神笔马良GaoGAN终于开源了

新智元

14+阅读 · 2019年4月17日

照片上的人出来了！云从3D人体重建登顶三项榜单，一张照片就能生成3D形象

照片上的人出来了！云从3D人体重建登顶三项榜单，一张照片就能生成3D形象

量子位

4+阅读 · 2019年3月20日

还在PS里手动描边？AI自动抠图只需5秒

还在PS里手动描边？AI自动抠图只需5秒

机器之心

12+阅读 · 2018年12月19日

仅四年时间 AI生成的人脸已经能骗过你的眼睛

仅四年时间 AI生成的人脸已经能骗过你的眼睛

cnbeta资讯

4+阅读 · 2018年12月18日

AI学会了视觉推理，“脑补”看不清的物体 | 李佳李飞飞等的CVPR论文

AI学会了视觉推理，“脑补”看不清的物体 | 李佳李飞飞等的CVPR论文

量子位

6+阅读 · 2018年3月31日

NIPS 2017：与李飞飞、哈萨比斯、Ian Goodfellow等7位大牛面对面

NIPS 2017：与李飞飞、哈萨比斯、Ian Goodfellow等7位大牛面对面

新智元

3+阅读 · 2017年12月17日

从0到1，漫谈步态识别那些事

从0到1，漫谈步态识别那些事

机器学习研究会

10+阅读 · 2017年9月24日

新 iPhone 推出的人像光效功能让人惊叹，这都是它的功劳

新 iPhone 推出的人像光效功能让人惊叹，这都是它的功劳

少数派

3+阅读 · 2017年9月15日

相关论文

CHIP: Channel-wise Disentangled Interpretation of Deep Convolutional Neural Networks

CHIP: Channel-wise Disentangled Interpretation of Deep Convolutional Neural Networks

Arxiv

5+阅读 · 2019年2月7日

Attend More Times for Image Captioning

Attend More Times for Image Captioning

Arxiv

6+阅读 · 2018年12月8日

ViZDoom Competitions: Playing Doom from Pixels

ViZDoom Competitions: Playing Doom from Pixels

Arxiv

5+阅读 · 2018年9月10日

Learning Blind Video Temporal Consistency

Learning Blind Video Temporal Consistency

Arxiv

3+阅读 · 2018年8月1日

Neural Network Interpretation via Fine Grained Textual Summarization

Arxiv

6+阅读 · 2018年5月23日

XGAN: Unsupervised Image-to-Image Translation for Many-to-Many Mappings

Arxiv

3+阅读 · 2018年4月25日

Low-Shot Learning from Imaginary Data

Arxiv

15+阅读 · 2018年4月3日

Improved Image Captioning via Policy Gradient optimization of SPIDEr

Arxiv

6+阅读 · 2018年3月12日

Deterministic Non-Autoregressive Neural Sequence Modeling by Iterative Refinement

Arxiv

4+阅读 · 2018年2月19日

DenseReg: Fully Convolutional Dense Shape Regression In-the-Wild

Arxiv

3+阅读 · 2018年2月1日

大家都在搜

大型语言模型

蓝牙安全攻防

朱克爱德华兹家族

冷启动，0预算，如何借助分销裂变引爆私域用户增长？

微信扫码咨询专知VIP会员