很多智能设备能预测我们下一步想要做什么,但是它们却无法知道为什么我们要那样做。
作者|DataGirls
本文经授权转载自DataGirls(ID:DataGirls)
《她》(Her) 是由斯派克·琼斯编剧并执导的一部科幻爱情片,讲述了作家西奥多在结束了一段令他心碎的爱情长跑之后,爱上了电脑操作系统里的女声,这个叫“萨曼莎”的姑娘非常了解西奥多,她有同理心,有感情,非常聪明,还能说服西奥多做各种有趣的事情,让他变得更快乐。
电影里的机器人,她们感情丰富,智力超群,比你还要懂你。如果现实生活中也有这样的机器人,说不定就能帮助那些有睡眠困扰的人,还能督促不爱运动的人多运动呢?
Rana el Kaliouby,一位剑桥大学博士,埃及裔美国计算机科学家,带领一支Affectiva情感科学队,采用计算机视角,机器学习和大数据科学,构建了据说是世界上最大的面部表情数据库,研发了一款面部和声音识别软件,帮助自闭症患者更好地与周围人相处。[2]
此外,这位美女科学家还有许多令人惊羡的头衔。全球最权威的青年科技创新人才榜:2012年麻省理工学院35 岁以下年度创新35人(MIT TR35 2012),《企业家》杂志(Entrepreneur Magazine)2014年最具影响力的7位女性之一(7 Women to Watch in 2014),2014年大众高科技领域最佳20名女性之一(Mass High Tech Top 20 Women to Watch 2014),曾被推选为名人堂中的“工程女性”("Women in Engineering" Hall of Fame),2018年福布斯榜单中美国高科技最佳50位女性之一(Forbes America's Top 50 Women In Tech 2018)等。[2]
这位集美貌与才华于一身的女性科学家,是怎样一步一步成长起来的呢?
Rana el Kaliouby是开罗美国大学 (The American University in Cairo) 的一名理学本科生,1998年,她以班上第一名的成绩毕业,并获得了攻读该校硕士的奖学金。本想以后能教授计算机科学,但是这份终身教授的工作却要求有海外博士的工作经历。Rana的爸爸建议她不要出国,“如果你出国读书了,等你回来年纪就太大了,很难嫁出去。”
Rana自己也不太确定,于是去应聘了当地一家科技创业公司。面试当天,她穿了一件裙子,显得很正式,因为这是她的第一次面试。面试地点在一个居民建筑楼里,Rana发现所有来应聘的男士们都穿着短裤,赤脚没有穿鞋,典型的软件工程师的模样。
当时,有个面试官指着Rana的裙子对她说,“我们没有椅子了,可能要在地板上面试。如果你觉得不方便,也可以改天来面试。”Rana当时很坚定,“没有关系,我能坐在地上。”于是,就有了一场坐在地上的面试。
几天以后,Rana还是选择了继续攻读硕士,放弃了工作申请,但是她对公司里的一个合伙人Wael Amin印象很深刻。Amin 从小在阿根廷长大,他很同情Rana的社会遭遇,鼓励她继续求学。不久之后,俩人便步入了婚姻殿堂。
一天, Amin分享给 Rana一篇来自麻省理工学院(Massachusetts Institute of Technology)多媒体艺术和科学领域的教授Rosalind Picard的书评,Rana读过之后立即订购了这本书。虽然耗时四个月才到开罗,但这本书还是给了Rana很大的启发,此后Picard便成了她心中的榜样。让潜心研究计算机如何改善人际关系的Rana,立志要创建能读懂面部表情的算法。
2001年,Rana研究生毕业以后前往剑桥大学攻读博士学位,期望能在此期间研发一款能识别面部表情模型,并用之编译更多数据。没想到她的导师和同门师兄姐妹们对情感计算(Affective computing)不太熟悉,许多人都觉得好奇,质疑她:为什么要做这些研究?
但Rana并未放弃,在一次研究目标的演示中,有一位观众提到训练计算机读懂面部表情的难度,和他患有自闭症的弟弟读懂他人的遭遇很类似。Rana对自闭症一无所知,她却以此为线索寻找更多可能性。巧的是,当时剑桥大学的自闭症研究中心正在做一个有关人类面部表情的大项目,希望自闭症患者能通过学习他们研发的表情目录,来帮助自己的社交互动。
Rana立即意识到这个表情目录带来了绝佳的好机会:那些丰富、有效的数据,非常适合用来训练计算机。等到博士毕业之际,Rana已经构建了一款名叫思维阅读(MindReader)的程序,能够记录非结构环境下的多种复杂的感情。
与此同时,她也在畅想能不能为自闭症患者发明一个可穿戴的设备,就像一台迷你型电脑,告诉他们要怎样做更合适,比如继续讲话,或者转换话题等。
在思考这个问题的那段时间里,Rana得知Picard将要拜访她的实验室,这个消息让Rana非常兴奋。
Picard本该只和每个学生10分钟谈话的时间,却和Rana聊了一个小时,还认为Rana研发的系统是她见过的最有意义的。最后,她们俩人决定合作,一起研发感情辅助器(emotional aid),这个计划得到了国际科学基金会(National Science Foundation)近百万美元的资助,从此开启了研发情绪识别技术的道路。
2007年,Rana和Picard开始为有行为障碍的孩子们做测试。有一次,一个害怕眼神交流的男孩引起了Rana的注意。她给男孩戴上相机,让他用iPad来“防御”别人的面部接触,而男孩则用iPad来看Rana,避免了眼神接触。
意想不到的是,这款设备让男孩说话时慢慢地变得有信心起来,他还放下了iPad,和Rana有了直接的眼神接触。Rana很兴奋地,“这真的很神奇,技术真的能够帮上忙。”
后来Rana把团队研发出来的思维阅读(MindReader)软件上传到服务器,并邀请赞助商体验下实验室所有的产品,看他们对什么软件感兴趣。
没想到,Rana的思维阅读软件很快位居下载榜首。
Pepsi好奇这款软件能不能帮他们测量消费者的喜好,Bank of America想在ATM机上使用。Toyota 想更好地理解驾驶人的开车习惯,以此设计一个系统来侦查他们的疲劳驾驶。接着络绎不绝的询问涌了进来,Microsoft, H.P., Yamaha, Honda, Gibson, Hallmark, NASA, Nokia都来询问,“这些数据到底意味着什么?”
太多需求,导致Rana所在的媒体实验室(Media Lab)不得不扩容,实验室主任Frank Moss建议她们走出去,因为只有市场才能让技术更为活跃,而且能帮助FOX的软件,肯定也能帮助自闭症患者。于是Rana和Picard便创办了情绪识别技术公司,Affectiva,一家基于情感计算(affectiva computing)的创业公司。
2011年3月,Rana和她的团队受邀给一家全球市场研究公司Millward Brown演示她们的系统,会中Rana坦言系统仍不完善,无法捕获扮鬼脸是否真的有笑容,但还是给总裁留下了非常深刻的印象。因为过去的广告依赖于大量的调查,仅仅处理了合理的心理反应,但是新技术对及时的、甚至潜意识里的情感都能捕获到,这让市场公司很感兴趣。随后,Millward Brown的母公司WPP给Affectiva投资了450万美元,而其核心情绪识别技术产品,Affdex也被广泛应用于测试成百上千的广告。
现在Affdex比大多数人都能更好地读懂微笑之间的细微差别,Affectiva公司的情感反应数据库也在快速增长,软件识别面部表情的能力越来越强了,“我们的准确率已经达到了90%以上。”
尽管Rana忙于为各大公司测试面部识别业务,比如 Facebook,Samsung,the Happiness Index,迪拜一家最繁忙的电视网络公司,但她没有放弃在自闭症方面的研究。“通过情绪识别技术,Affdex会帮助你拥有一个积极乐观的心情,这将有助于你的健康。”[3]
参考资料:
[1]https://www.forbes.com/sites/samarmarwan/2018/11/29/affectiva-emotion-ai-ceo-rana-el- kaliouby/#1ebf42ad1572
[2]https://en.wikipedia.org/wiki/Rana_el_Kaliouby
[3]https://www.newyorker.com/magazine/2015/01/19/know-feel