脸是公开的,但低成本、快速、大量地记录、存储和分析人脸图像的能力,终有一天会带来隐私、公平和信任等观念的根本性改变。人脸识别不只是另一种技术。它将改变社会。
来源 | 《经济学人》
编译 | 张震、邱陆陆、项文虎
政府将在北京市所有公租房推广人脸识别技术,用以查获保障房违规转租现象。去年,海淀金隅翡丽小区开始推行「人脸识别」门禁系统。截至目前,已累计查处违规转租转借 117 起。在中国已有多种应用的「刷脸」会成为新一代 iPhone 的屏幕解锁手段,亚马逊、微软等巨头都在使用云服务提供人脸识别。
脸,是大自然的杰作。四个月大婴儿即可识别面部表情,懂得非语言交际信号,比如微笑、生气。丰富的面部特征也是形成复杂人类社会的关键。如今,科技正迅速赶上人类研读脸孔的能力。
一、渗透中的面部识别技术
旷世公司总部大厅,摄像头眨眼功夫即可识别出访客。有些照片会被显示在一面叫做「天网」的视频墙上。某幅画面中,一群工作人员正在电梯口等待,每个人的面部都被一个白框锁定,同时标有每个人的名字。旷视 CEO 印奇说:「这有助于抓住坏人。」
即使印先生想要思考这项技术所带来的影响,他也不会有这个时间,因为旷视正在忙于构建一个视觉计算的「大脑」。2011 年成立以来,旷视一直在快速发展。目前服务全球 300,000 多家公司和个人用户,已经成为该领域最大服务提供商之一。去年 12 月,旷视融资 1 亿美元,估值近 20 亿美元。这也意味着旷视成为人脸识别领域第一家估值超过 10 亿美元的独角兽。
该领域的供应商通常销售面部识别硬件和软件,同时将这些人脸数据与其他更大的数据结合起来。尽管市场不大(乐观估计,市场规模约在几十亿美金左右),但是,这项技术正渗透到更广阔的商业环境中,因为面部识别准确性正在迅速提升,这与语音识别类似,准确率都从百分之几提升到近乎 100%。「大多数人都低估了 95% 的准确率和 99% 的差别——99% 意味着改变游戏规则。」著名 AI 学者吴恩达曾这样评价语音识别。
更重要的是,手机即可进行面部识别,就像 Echo 具有语音识别功能。数以百万计的中国人已经通过智能手机上的「刷脸」功能来授权支付。9 月 12 日,苹果将推出新款 iPhone,外界猜测其技术可通过准确识别用户的面部来解锁,即使在光线暗淡的环境中。几周前,三星推出的新款 Galaxy Note 也有类似功能,但没有那么复杂。
将面部识别技术分为这两类是有意义的:底层功能与应用。旷视属于前者,类似企业还有中国的商汤科技、俄罗斯的 NTechLab,以及亚马逊、IBM 和微软,他们都将人脸识别作为一种云服务。客户可以上传一批图片和名字,再利用这些数据训练算法,旷视用户即可识别特定人群。企业也可以将这项服务结合到自己的产品中,例如,控制在线账户访问。
旷视和商汤的服务很大程度上依赖海量的优质数据。他们可以访问中国政府存储的 7 亿公民的图像数据库(每个人在 16 岁的时候都会有一张身份证照片)。实际上,政府机构也是很有价值的客户。数以亿计的监控摄像头也将很快地融入人脸技术。在深圳,人脸识别可以被用来捕捉乱穿马路的人;在北京,市政当局已经这项技术识别公厕里偷纸的人(这套系统还规定每个人在 9 分钟内只能取走 60 厘米的纸张。)
技术的商业应用,也是云计算服务的内容之一。9 月 1 日,蚂蚁金服第一次在实体店部署「微笑支付」系统:在杭州肯德基 KPRO 绿色餐厅,顾客可以通过注视屏幕来结账。小麦便利店也宣称将使用面部扫描检测分析店内顾客的行为。此外,几家银行已经允许用户(比如招商银行)使用面部识别技术在 ATM 上开户。
如今,面部识别技术正变得更好、更便宜,也正在广泛普及开来。
相比之下,西方已经远远落后了。尽管一些行业很早开始使用基本的面部识别技术,例如赌场用来赶走名声不好的赌徒,但基本上只有大型公司(谨慎地)使用这项技术。Facebook 发展最快。通过用户标记的朋友照片,Facebook 算法能够在其他的照片中认出相同的人物。谷歌利用这项技术,自动将用户上传的图片进行归类。亚马逊虽然在发展智能音箱,但下一代的 Echo Look 会配有一个摄像头,外界猜测它将具有人脸识别的功能。
其他公司正在试水。捷蓝航空和其他航空公司正在寻找匹配乘客面部与护照照片的新方案,旨在取消登机牌这一流程(百度已经和北京机场达成这一方面的合作)。Lloyds 也不是唯一一家准备向中国学习的西方银行,他们都希望能够用户可以「刷脸」登录账户。Uber 在印度要求司机在换班前自拍一张,以此减少未注册司机顶替上岗的现象。芯片制造商英伟达已经计划在新的加州总部启用人脸识别应用。
这也有助于提升产品销量。例如,摄像头可以识别忠诚顾客和 VIP 成员,为他们提供特别服务。系统还可以觉察顾客脸上不满情绪,派出员工进行有效的干预。据称,全球最大的零售商沃尔玛正在开发一套人脸识别系统系统,以此改善顾客服务体验。
意料之中的是,这项服务也大大促进了反向的产业发展。例如,以色列初创公司 D-ID 已经开发出一种软件,工具处理后的图像无法被人脸识别算法侦测,但是肉眼观之,其与原始图片看起来一样。
然而,这些安全应用并不会阻止人脸识别的大规模应用。旷视的印奇认为,面部识别技术会成为一种商品。这也是他把眼光放得更远的原因。公司的计算机视觉大脑正迈向解决更复杂的任务,例如,解释人类的行为和识别特定物体。长远来看,印奇希望他的公司能够发展成为一家「算法工厂」,为计算机视觉服务提供各样模块化产品。
二、创建面部、治愈与希望
Graig Venter 最近一次刺激到公众的行为是他发布了一项根据人们的基因数据预测人的长相的工作。
在本周发表在《美国国家科学院院刊》(Proceedings of the National Academy of Sciences) 上的一篇论文中,Venter 博士和他的同事们描述了这个被他们称之为「基于表现型的基因组识别」的过程。该小组从不同年龄不同种族的 1061 名被试,进行了基因组测序。他们还拍摄了被试者面部的高分辨率、三维图像,并记录了他们眼睛和皮肤的颜色、年龄、身高和体重。这些信息被用作「训练集」,用来开发一种能够根据基因计算出人们长相的算法。
通过将这种算法应用于未知的基因组,研究小组能够生成几乎与真实照片相匹配的图像,成功率 80%。(当测试仅限于单一种族的时候,成功率就降低到了不那么的出众的 50%,因为限定种族缩小了面部的差异。) 大约一年前,使用同样的算法,该公司开发了一个功能,根据母亲的基因组预测她 20 岁时的样子。结果可以与她在那个年龄的照片相比,并让读者自己判断其相似性。
Venter 的预测只是基于相对较少的人群。通过机器学习技术,数据集越大,结果越好;与数以万计的基因组结合,可以大大提高预测速度。
生物学家 Graig Venter 是生物公司 Human Longevity 的老板。这家位于圣地亚哥的旨在建造世界上最大的基因组数据库的公司。上世纪 90 年代末,Graig 宣布,国际上通过公共资助的项目对人类基因组进行排序的组织方法是错误的,他开发了一种更便宜且更快的方法。
Human Longevity 已经收集了 45,000 个基因组,其中大部分来自于参加了与特定身体特征相关的临床试验的实验者。该公司利用机器学习工具分析这些数据,然后根据基因序列预测身体特征。现在这项技术已经提高到,公司根本不需要看到一个人就能生成他的照片。
从基因组中创建照片有很多潜在的用途,尤其是在法医科学领域。从罪犯遗留下来的任何遗传物质 (如血液或体液) 中,也许可以重建罪犯的面孔。这将让警察在谋杀、故意伤人和强奸案件中「看到」嫌疑犯的面孔。它还可以帮助识别被烧伤或致残到无法辨认的受害者。如果仍有合适的基因样本留下,那些尘封的悬案可能会重见天日。
人脸不仅仅能表明身份,它还显示了许多其他信息,同样能由机器读取。这也带来了一些其他益处。
Face2Gene 是 FDNA 公司开发的智能手机应用。FDNA 公司是由 Moti Shniberg 和 Lior Wolf 共同创立的一家位于波士顿公司。Shniberg 之前从开发了一个识别上传至社交媒体网站的照片中的人的标记算法,被 Facebook 收购了。FDNA 应用程序允许医生拍摄病人的照片,并将其上传到互联网(连同患者的身高、体重和临床数据),让 Face2Gene 的算法从其在线数据库中索引,生成一份可能的疾病清单。该应用可以访问 10000 种疾病的信息;到目前为止,面部识别可以预测其中 2500 种。
每种诊断都会附带一个反映出应用程序正确的概率。程序还列出了任何已知的会导致该疾病的基因突变,有助于分析患者的病情。FDNA 的首席执行官 Dekel Gelbman 估计,这款应用正被 130 个国家的医生和研究人员使用。所有的患者数据经过了匿名化和加密,以保护隐私。
有了 Venter 博士的工作,为研究人员提供的数据池越深,它就越有价值。牛津大学的 Christoffer Nellaker 已经设立一个叫「米纳发和我」的网站,健康和患病人士均可上传自己的照片,授权相应研究使用他们的图片。另外,他也成立了一个叫做 Minerva Consortium 的网络,鼓励人工智能研究人员共享数据。
国立人类基因组研究院的 Maximilian Muenke 、国立儿童健康系统的 Marius Linguraru 以及同事们正在尝试扩大研究。他们发表了一系列使用了面部识别算法的研究,这些算法使用了亚洲、非洲以及拉美人口的照片数据,识别不同基因疾病,准确率高达 90% 以上。在许多贫穷国家,识别基因疾病的产前测试很昂贵,人们消费不起。比如,一个患有唐氏综合症的婴儿,通常在产前就可以检测出(欧洲和亚洲),但是在贫穷国家,孩子不到一岁就无法诊断出唐氏综合症。研究人员有意开发出一款医生通过智能手机即可识别最常见症状的应用程序,减少这类悲剧的发生。
三、最后的防线
这些技术也造成了威胁。首先涉及隐私。相比指纹等其他生物特征数据,人脸的一个巨大区别就是它们能够远距离起作用。人们只要有手机就可以拍下照片,供人脸识别程序使用。这意味着公民隐私可能遭受更大的损害。
Venter 博士指出,基因组信息必须被视为个人信息,即使它展现出来不过是一个无意义的字母序列。他警告说,从人们目前在网上发布的、来自 23andMe 等 DNA 检测服务的有限的基因数据中就能构建一张面孔画像。
这反过来又增加了人们对将基因信息纳入公共测序工作的抗拒,尽管这样的工作可以帮助人类整体对抗疾病的工作。如果可以用基因组来做面部预测,那么人们的外表就可以与真实的在线照片相匹配。这可能意味着人们的基因序列,以及他们所有的基因缺陷,都可以在网上与他们的身份联系起来。
最近,斯坦福大学 Michal Kosinski 和 Yilun Wang 所做的研究表明,机器视觉通过分析人脸可以推断人的性取向。人类无法从面部判断的内容,并不意味着机器也分析不出来。
研究基于超过 35,000 张美国交友网站上男女的头像图片训练。论文作者利用深度神经网络从图像中提取特征,利用大量数据让计算机学会识别人们的性取向。研究发现,同性恋男女倾向于具有「性别非典型」特征、表情和「打扮风格」。理论上,男同性恋趋向于女性化,而女同反之。在研究中,人们还找到了一些其他的趋势,如同性恋男人有比直男更窄的下巴,更长的鼻子以及更大的前额;而同性恋女性相比「直女」趋向于有更大的下巴、更小的前额。
在「识别同性恋」任务中,人类的判断表现要低于算法,其准确率为在男性中 61%,在女性中 54%。当软件识别被测试者的图片(每人五张图片)时,准确率则显著不同:男性 91% 准确率,女性 83% 准确率。研究人员在论文中写道,广义上,这意味着「人类面孔包含了比人类大脑可以感知和解释的更多的性取向信息」。
在那些视同性恋为犯罪的国家,一个能从面部推断出性取向的软件让人恐惧。
卡内基梅隆大学的 Alessandro Acquisti 谈到,他曾展示过面部识别和在线信息可帮助获取个人的社会安全号码(美国发给公民、永久居民、临时(工作)居民的一组九位数字号码,社会安全号码主要的目的是为了追踪个人的赋税资料。)对于那些不想公开这一号码的人员来说,无疑是个坏消息。
另外,面部识别技术也会让不那么暴力的歧视变得普遍。
比如,雇主本来就可能会根据自己的偏见来拒绝雇用某个人,而人脸识别也许会让这种偏见成为常态。再比如,这类系统可能会对那些非白色皮肤的人有偏见,因为用来训练算法的数据集里大部分是白人面孔,这样的算法不太适用于其他种族。在影响法院保释和量刑决定的自动评估工具中,已经出现过这样的偏见。
最终,持续的面部记录和用计算机数据测量真实世界的小工具可能会改变社交互动的本质。掩饰有助于润滑日常生活的齿轮。
如果你的伴侣能发现每一个强压下去的哈欠,你的老板能觉察每一丝恼怒的表情,婚姻和工作关系都会变得更真实,但也更不和谐。社交互动的基础可能也会改变,从基于信任的一系列承诺,变成对风险和回报的算计,这些算计则源自于计算机对人们面部信息的解读。人际关系可能变得更理性,但也变得更像交易。
四、逃不脱的未来
至少在民主国家,立法可以帮助改变利弊之间的平衡。欧洲监管机构已在即将出台的数据保护法规中嵌入了一套原则,规定包括「脸纹」在内的生物信息属于其所有者,使用这些信息需要征得本人同意。
然而,这类规定并不能改变发展的方向。随着可穿戴设备的普及,摄像头只会越来越普遍。从太阳镜到化妆,试图欺骗人脸识别系统的种种努力已被挫败。剑桥大学的研究表明,人工智能可以重建伪装之下的面部结构。谷歌已经明确表示不会将面部信息和身份匹配,担心这会被非民主政权滥用。其他的科技公司似乎没那么讲究。亚马逊和微软都在使用它们的云服务来提供人脸识别,这项技术也是 Facebook 计划的核心。政府不会想放弃自己的利益。
改变即将到来。直面它吧。