AI大佬批它炒作、小扎马斯克却相继投资,这家神秘公司终于亮相

2017 年 11 月 10 日 PingWest品玩 硅星人

深度学习大师 Yann LeCun 批评它为「教科书式的 AI 炒作」马斯克、贝佐斯,以及 LeCun 的老板扎克伯格,却都投资了它……


这家神秘的公司,就是 Vicarious.ai。它正在参照人脑的逻辑,设计人工智能。


1

2013 年 10 月 23 日,在自己的 Google+ 页面上,Yann LeCun 突然朝 Vicarious 开炮了。

当时,Yann LeCun 已经是当代光学字符识别技术 (OCR) 之父,卷积神经网络 (CNN) 的主要贡献者,深度学习技术的领军人物。

而后者还只是一家小公司,创办三年有余,名不见经传。

「警惕:这是教科书级别的人工智能炒作,最烂的那种,」LeCun 写道,「炒作对人工智能很危险。在过去 50 年里,炒作已经四次杀死了人工智能。人工智能炒作必须被阻止。」

Vicarious 究竟做了什么,让贵为「深度学习三巨头」之一的 LeCun 如此愤怒?

原来,13 年早些时候,Vicarious 搞了个大新闻:攻破了 CAPTCHA 验证码,成功率高达 90%。

CAPTCHA 就是验证码,咱们大家应该都见过,它的主要用途是让服务器确定执行操作的是用户本人,而不是机器人,从而避免账户盗窃,或者论坛里恶意灌水的情况出现。CAPTCHA 通常长下面这个样子:

你可以看到,跟常规的字体相比,CAPTCHA 的字符发生了倾斜、扭曲,有的被中间一条线分割,还有的加上了背景噪音。这么做的用意是让 OCR 无法识别文本,但人眼+人脑仍然能够比较容易地辨别。

过去,人们也曾破结果 CAPTCHA ,但准确率都比较低,从没见过 90 %这么高的数字。

这样,你应该差不多能明白了:

作为 OCR 专家,几个无名小辈居然跑出来破解了自己一直搞不定的 CAPTCHA,能不生气吗……

当然,戏谑归戏谑,Yann LeCun 说的也不无道理

1)Vicarious 口说无凭,不发论文,连个文档都不给,还找了一大堆媒体报道;

2)在当时,CAPTCHA 已经不是特别流行的验证方式了,而且在计算机视觉领域,Google 百度等都有更厉害的技术,LeCun 觉得这伙人简直是在浪费时间。

——这才是 Vicarious 真正让 LeCun 感到气愤的原因。

然而后来发生的事情,让很多人都没意料到。

科技大佬们不知道是独具慧眼,还是偏要跟 LeCun 对着干,Vicarious 拿到了杰夫·贝佐斯、马克·扎克伯格和伊隆·马斯克的投资。其他投资方,还包括杨致远(雅虎创始人)、萨姆·奥特曼(YC 主席)、马克·贝尼奥夫(Salesforce CEO)、阿什顿·库彻(好莱坞演员、天使投资人)、Khosla Ventures、Founders Fund、三星等不少一线机构和公司。

——讲真,马斯克和扎克伯格……能同时得到 AI 威胁论和 AI 无威胁论代表人物的投资,也算是一种肯定了。

而 Yann LeCun 呢?13 年底,他也被扎克伯格请到了 Facebook ,担任人工智能研究院 (FAIR) 院长。

至于老板投资过的公司,LeCun 再也没有发表过任何看法。

2

得到半个硅谷大佬圈的支持并不能证明什么,美国从来没禁止过骗子融资和创业。人们就想知道一件事:Vicarious 到底有没有真货?

为了这个答案,人们足足等了四年。

2017 年 10 月底,Vicarious 题为《采用极高数据效率训练生成式视觉模型,突破文本型验证码》(A generative vision model that trains with high data efficiency and breaks text-based CAPTCHAs) 的论文,终于刊登在了《科学》期刊上。[1]

尽量简单来描述一下,Vicarious 是如何实现以无人能及的准确率对 CAPTCHA 完成突破的:

灵长类动物(比如人类)视觉认知依赖大脑的视皮层 (Visual Cortex),而视皮层的工作方式是神经元判别所看到的细小元素,逐级向上汇总,形状形成轮廓、轮廓形成笔划、笔划形成字母,最终有了一个大概的认知。

这也是为什么我们能够像上图中 A 和 B 一样,在极强的干扰下识别出文本。或者一个更简单的例子:ʇxǝʇ,一般人很快就能意识过来其实是 text 倒过来了,但常规的 OCR 和深度神经网络却无法识别。

这个层级的汇报制度,可以逾越单个字母的范畴,上升到整个单词,甚至是句子,甚至形象和文字的关联。如上图 C 案例 1:孤立地看可能以为是 m,联系旁边字母看可能会发现其实是 o u n;案例 2:相同的笔划安排,配合不同的视觉干扰,变成了 N 或者 S;案例 3:在象形的帮助下,能辨别出单词分别是 Bison(野牛)和 bike(自行车)

而 Vicarious 的研究人员按照这种逐级向上汇报的工作原理,设计了一个新的神经网络结构,将其命名为「Recursive Cortical Network」(递归皮层网络,RCN)。

通过这个层级结构,在形状、文字表面和背景纹理(噪音)的污染前提下,RCN 仍能够最终以较高的准确率识别出 CAPTCHA 文字。

而且,它的训练效率更高,达到相同的准确度,训练样本数只用了深度学习方法的百万分之一;它的泛化性能更强——意思是一次训练,可以用来破解各个不同的 CAPTCHA 变体。

比如,在 2013 年,Vicarious 用同一个 RCN 模型,攻击 reCAPTCHA 准确率达到 66%(真人平均准确率为 87%),攻击 BotProtect、雅虎、PayPal 等验证平台的准确率也都超过了一半。

3

这么华丽的技术,为什么论文公布却等了四年?

在周末举行的顶级人工智能大会 AI Frontiers Conference 上,硅星人(微信公众号:guixingren123)采访到了 Vicarious 首席技术官 Dileep George。

他的解释是:

在当时 CAPTCHA 还是一个重要的验证方式,而他们的方法容易使用,如果直接发布论文的话,立刻会被黑帽们采用,造成破坏。好在,目前 CAPTCHA 已被更安全的验证方式取代,现在发布论文时机合适了。

至于你信不信,硅星人反正信了——那么多大佬和顶级机构都投资了 Vicarious,该公司网站顾问一栏还写着李飞飞博士的名字。不会大家都没做尽调吧?

尽管引发 LeCun 的抨击带来了大量的关注,但攻破 CAPTCHA 并不是 Vicarious 成立的目的。

现在 Vicarious 已经证明了自己。接下来呢?

George 一贯的回答是:人工智能(AI)的关键就在 A(解决字母识别)上。接受机器之心采访时,George 说 CAPTCHA 就是一个完全的人工智能问题。「如果你完全地解决了这种类型的问题,那你就得到了通用人工智能。」

但显然,实现通用人工智能并不是识别出一个歪七扭八的 A 就能解决的。

过去十多年,深度学习技术一直推陈出新,新的神经网络结构一次又一次让人们感觉「从未离真正的人工智能如此之近」。尽管这些结构都冠以「神经」的名字,实际上它们只是通过统计学和几何学来「模拟」人脑思维的复杂程度,却并未真正复现人脑的思维方式。看看各位研究者的简历,提到脑科学的少之甚少。

而我们到底对人工智能在期待些什么?极强的自学能力,能够击败最强的围棋选手?还是惊人的算力和逻辑组织,能够让整个社会运行地更稳定?

都不是。

当一个程序自称人工智能的时候,我们对它的首先期待是同理心。

这是一个极其复杂,很难用公式体现的要求,也是 Vicarious 值得关注的,它能得到众多科技大佬支持的原因。或许,我们暂时不知道该怎样为同理心建模,但我们知道,像人一样去观察事物,进而思考和理解事物,可能是正确的途径。

4

今年 10 月,纽约大学精神、大脑和意识研究中心举办了一场备受瞩目的辩论。

交战双方各只有一人,分别为是 Yann LeCun,本校的计算机教授,和加里·马库斯 (Gary Marcus),本校的心理学教授。

这场辩论堪称人工智能领域“机器派”和“自然派”的巅峰对决。

毫无疑问,LeCun 是前者的忠实拥趸,认为机器学习技术现在发展良好,方向正确;马库斯则站自然派,认为通用人工智能的实现需要机器结合人脑。

辩论十分激烈精彩,持续了两个小时左右。如果说之前人们争辩的焦点在人工智能威胁论是否有其道理,那么这场辩论在很大程度上帮助焦点转移到了实现通用人工智能的流派上。

在这次 AI Frontiers Conference 上,开场的吴恩达在他的演讲末尾提了一句:现在的论文够多了,大家应该把精力放在解决问题上。

研究够不够先进,论文够不够多,指标口径仍有待商榷,但吴恩达的表态从另一方面体现出:目前基于深度学习的人工智能研究,可能已经遇到瓶颈了。用传统的方式,已经不能再取得更 state of the art 的结果。

走出瓶颈,机器和人脑的结合会否成为关键?

至少 Vicarious 是这样认为的。

[1] Science Mag. A generative vision model that trains with high data efficiency and breaks text-based CAPTCHAs http://science.sciencemag.org/content/early/2017/10/26/science.aag2612.full

硅星人的合作伙伴、硅谷顶级人工智能前沿大会 AI Frontiers Conference 吸引了来自Google, Facebook,亚马逊,微软,英伟达等企业界的人工智能团队总监,首席科学家,资深专家参会,带来了人机对话(Chatbot), 自然语言处理(NLP),自动驾驶(autonomous driving), 机器人(Robot), 视频分析(Video Analysis), 游戏(Games),深度学习突破性进展(Deep Learning breakthrough)等领域的最新进展。



长按二维码关注“硅星人”,

让你看到最不一样的硅谷!

登录查看更多
8

相关内容

杨立昆(法语:Yann Le Cun,英语:Yann LeCun,1960年7月8日-)(原中文译名:扬·勒丘恩)是一位计算机科学家,他在机器学习、计算机视觉、移动机器人和计算神经科学等领域都有很多贡献。他最著名的工作是在光学字符识别和计算机视觉上使用卷积神经网络 (CNN),他也被称为卷积网络之父。他同Léon Bottou和Patrick Haffner等人一起创建了DjVu图像压缩技术。他同Léon Bottou一起开发了Lush语言。
Capsule Networks,胶囊网络,57页ppt,布法罗大学
专知会员服务
68+阅读 · 2020年2月29日
最新!Yann Lecun 纽约大学Spring2020深度学习课程,附PPT下载
IBM《人工智能白皮书》(2019版),12页PDF,IBM编
专知会员服务
20+阅读 · 2019年11月8日
为什么AI公司都在一边融资,一边投资?
腾讯创业
6+阅读 · 2018年9月25日
已删除
雪球
6+阅读 · 2018年8月19日
谷歌要输给“邪恶的独角兽”了
商业周刊中文版
3+阅读 · 2017年12月17日
AI都干过什么让人细思极恐的事?
全球创新论坛
4+阅读 · 2017年9月15日
Nocaps: novel object captioning at scale
Arxiv
6+阅读 · 2018年12月20日
Large-Scale Study of Curiosity-Driven Learning
Arxiv
8+阅读 · 2018年8月13日
Arxiv
5+阅读 · 2018年5月22日
Arxiv
10+阅读 · 2018年2月17日
Arxiv
7+阅读 · 2018年1月31日
VIP会员
相关资讯
为什么AI公司都在一边融资,一边投资?
腾讯创业
6+阅读 · 2018年9月25日
已删除
雪球
6+阅读 · 2018年8月19日
谷歌要输给“邪恶的独角兽”了
商业周刊中文版
3+阅读 · 2017年12月17日
AI都干过什么让人细思极恐的事?
全球创新论坛
4+阅读 · 2017年9月15日
Top
微信扫码咨询专知VIP会员