50张图片做出李飞飞数万张的效果,类脑AI竟然这样玩?

2018 年 9 月 1 日 量子位
郭一璞 发自 凹非寺 
量子位 报道 | 公众号 QbitAI



这张毛色艳丽“星空猫”,在经过图像处理之前长这样:



没有了迷幻背景和油画般的毛色,顿时变成了三只“凡猫”。

一个不懂GAN也不会PS的普通人,完成这样的图像处理要几分钟?

在微信通讯录里锁定设计师大神……1分钟;

组织语言求大神帮忙……5分钟;

等大神回复……30分钟;

大神发来了他的报价……卒。

但是对马卡龙玩图的用户来说,只要点几下屏幕就够了。

上传原图,APP自动抠出三只猫;

把背景和猫的渲染风格都设置成星空;

降低猫的亮度,提高猫的对比度。

三步完成只有设计师才能做出的效果,依靠的是马卡龙玩图APP背后的类脑人工智能技术。

一家“沉迷”类脑的AI公司

马卡龙玩图APP之前的名字叫Versa,和背后的这家公司的名字一样。

作为一家专做“P图”的AI创业公司,Versa的研究方向和别家不同:

不做大数据人工智能,专做类脑人工智能。

Versa的CTO赵维杰向量子位介绍了他们的研究方向和特点。

类脑人工智能和基于大数据的人工智能不同,是机器学习的另一个分支,研究类脑计算,以及概念表示、迁移与生成,和脑科学的关系更近一些。

相比依赖大数据进行模型训练的神经网络,类脑人工智能可以实现和人类小孩认识世界类似的能力,仅仅通过少量数据就可以实现一些效果。

比如说,李飞飞2016年的ECCV论文《Perceptual Losses for Real-Time Style Transfer
and Super-Resolution》用到的方法,实现每种风格需要4~8万张图片来进行训练,而Versa的通过类脑人工智能进行风格迁移,每种风格只需要50张图片就可以了。



 Gatys和李飞飞的风格迁移效果图

概念迁移则是类脑人工智能的另一个优势。拿图片来举栗子,概念迁移是指可以将颜色、形状等基础概念,加上语义,拼接成复杂概念。

作为一家以P图为核心的公司,类脑人工智能便于实现概念迁移的特点也让Versa在“抠图”这个步骤中取得了优势,赵维杰自信满满的说他们的准确率超越了谷歌的Deeplab V3+大约5个百分点,达到了95.7%。



 抠出人物就可以换背景啦

类脑人工智能的第三个优势“无中生有”被Versa用在了姿态估计上。

通过单目摄像头拍摄出的景象,类脑人工智能“脑补”出景深,可以方便实现3D姿态估计。

类脑狂人赵维杰

说赵维杰是个类脑狂人一点也不为过。



目前,赵维杰不仅是Versa的CTO,还是Versa和上海交大的脑科学与人工智能联合实验室主任。

早在2012年,赵维杰就已经开始研究类脑人工智能方向了。

在他看来,依靠大数据的人工智能只能解决一小部分问题,比如图像识别等;而在更广阔的应用场景中,人们无法获得如此大量的数据,只能靠类脑人工智能来解决。

而类脑人工智能本身的概念迁移能力,更让研发的速度足够快。“任意一个基于脑科学的AI公司,都非常容易建立起长期的技术壁垒,”赵维杰说,“假设说现在我们的图像分割算法可能领先行业六个月的话,那我们下一个算法一定领先行业要一年。”

这也让赵维杰找到了自己的创业方向——不是安防、医疗这类基于大数据人工智能的偏B端生意,而是服务更多人、更加多元化的文化产业,通过便捷的图像处理,让不管是设计师还是普通人都可以享受到AI带来的方便和乐趣。

或许,这也是一个AI创业的灵感:谁说底层技术必须服务于B端?

赵维杰告诉量子位,目前Versa在APP端已经拥有1200万用户,未来准备继续在C端通过马卡龙玩图APP服务普通用户,在B端通过Adobe插件的形式,服务专业的设计师,让设计师们不再花大量时间精力用在简单的抠图上。

One More Thing

Versa给量子位展示了马卡龙玩图APP下一个版本即将上线的新功能,名叫inpainting,可以一键P掉照片里的人物。



注意“仙人洞”中的那个白衣女子。



不见了。

另外,他们还准备把“抠图”功能应用在视频里,比如把这样一段电影:



变成这样:



你觉得效果如何?

最后,读者朋友们对类脑人工智能怎么看?欢迎评论区留言。

加入社群

量子位AI社群19群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;


此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。


进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态



登录查看更多
1

相关内容

玩图-全能手机P图神器。不但基础功能强大,而且还有画中画,拼立得等创新功能。
Yoshua Bengio最新《深度学习》MLSS2020教程,附104页PPT及视频
专知会员服务
130+阅读 · 2020年7月10日
【MIT-ICML2020】图神经网络的泛化与表示的局限
专知会员服务
42+阅读 · 2020年6月23日
斯坦福2020硬课《分布式算法与优化》
专知会员服务
118+阅读 · 2020年5月6日
【论文】结构GANs,Structured GANs,
专知会员服务
14+阅读 · 2020年1月16日
AI上色对比人工调色 :结果令人难以置信
网易智能菌
8+阅读 · 2019年4月25日
还在PS里手动描边?AI自动抠图只需5秒
机器之心
12+阅读 · 2018年12月19日
仅四年时间 AI生成的人脸已经能骗过你的眼睛
cnbeta资讯
4+阅读 · 2018年12月18日
从0到1,漫谈步态识别那些事
机器学习研究会
10+阅读 · 2017年9月24日
Attend More Times for Image Captioning
Arxiv
6+阅读 · 2018年12月8日
ViZDoom Competitions: Playing Doom from Pixels
Arxiv
5+阅读 · 2018年9月10日
Learning Blind Video Temporal Consistency
Arxiv
3+阅读 · 2018年8月1日
Arxiv
15+阅读 · 2018年4月3日
VIP会员
Top
微信扫码咨询专知VIP会员