这张毛色艳丽“星空猫”,在经过图像处理之前长这样:
没有了迷幻背景和油画般的毛色,顿时变成了三只“凡猫”。
一个不懂GAN也不会PS的普通人,完成这样的图像处理要几分钟?
在微信通讯录里锁定设计师大神……1分钟;
组织语言求大神帮忙……5分钟;
等大神回复……30分钟;
大神发来了他的报价……卒。
但是对马卡龙玩图的用户来说,只要点几下屏幕就够了。
上传原图,APP自动抠出三只猫;
把背景和猫的渲染风格都设置成星空;
降低猫的亮度,提高猫的对比度。
三步完成只有设计师才能做出的效果,依靠的是马卡龙玩图APP背后的类脑人工智能技术。
马卡龙玩图APP之前的名字叫Versa,和背后的这家公司的名字一样。
作为一家专做“P图”的AI创业公司,Versa的研究方向和别家不同:
不做大数据人工智能,专做类脑人工智能。
Versa的CTO赵维杰向量子位介绍了他们的研究方向和特点。
类脑人工智能和基于大数据的人工智能不同,是机器学习的另一个分支,研究类脑计算,以及概念表示、迁移与生成,和脑科学的关系更近一些。
相比依赖大数据进行模型训练的神经网络,类脑人工智能可以实现和人类小孩认识世界类似的能力,仅仅通过少量数据就可以实现一些效果。
比如说,李飞飞2016年的ECCV论文《Perceptual Losses for Real-Time Style Transfer
and Super-Resolution》用到的方法,实现每种风格需要4~8万张图片来进行训练,而Versa的通过类脑人工智能进行风格迁移,每种风格只需要50张图片就可以了。
而概念迁移则是类脑人工智能的另一个优势。拿图片来举栗子,概念迁移是指可以将颜色、形状等基础概念,加上语义,拼接成复杂概念。
作为一家以P图为核心的公司,类脑人工智能便于实现概念迁移的特点也让Versa在“抠图”这个步骤中取得了优势,赵维杰自信满满的说他们的准确率超越了谷歌的Deeplab V3+大约5个百分点,达到了95.7%。
类脑人工智能的第三个优势“无中生有”被Versa用在了姿态估计上。
通过单目摄像头拍摄出的景象,类脑人工智能“脑补”出景深,可以方便实现3D姿态估计。
说赵维杰是个类脑狂人一点也不为过。
目前,赵维杰不仅是Versa的CTO,还是Versa和上海交大的脑科学与人工智能联合实验室主任。
早在2012年,赵维杰就已经开始研究类脑人工智能方向了。
在他看来,依靠大数据的人工智能只能解决一小部分问题,比如图像识别等;而在更广阔的应用场景中,人们无法获得如此大量的数据,只能靠类脑人工智能来解决。
而类脑人工智能本身的概念迁移能力,更让研发的速度足够快。“任意一个基于脑科学的AI公司,都非常容易建立起长期的技术壁垒,”赵维杰说,“假设说现在我们的图像分割算法可能领先行业六个月的话,那我们下一个算法一定领先行业要一年。”
这也让赵维杰找到了自己的创业方向——不是安防、医疗这类基于大数据人工智能的偏B端生意,而是服务更多人、更加多元化的文化产业,通过便捷的图像处理,让不管是设计师还是普通人都可以享受到AI带来的方便和乐趣。
或许,这也是一个AI创业的灵感:谁说底层技术必须服务于B端?
赵维杰告诉量子位,目前Versa在APP端已经拥有1200万用户,未来准备继续在C端通过马卡龙玩图APP服务普通用户,在B端通过Adobe插件的形式,服务专业的设计师,让设计师们不再花大量时间精力用在简单的抠图上。
Versa给量子位展示了马卡龙玩图APP下一个版本即将上线的新功能,名叫inpainting,可以一键P掉照片里的人物。
注意“仙人洞”中的那个白衣女子。
不见了。
另外,他们还准备把“抠图”功能应用在视频里,比如把这样一段电影:
变成这样:
你觉得效果如何?
最后,读者朋友们对类脑人工智能怎么看?欢迎评论区留言。
— 完 —
加入社群
量子位AI社群19群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;
此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。
进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态