作者 | 平凡
头图 | CSDN 下载自视觉中国
出品 | CSDN(ID:CSDNnews)
情感AI是一个跨学科领域,涉及计算机科学、 心理学和认知科学,旨在研发能够识别、解释、处理、模拟人类情感的系统。[虽然该学科最早可追溯至早期的哲学研究,即人们对情绪的剖析,但真正使其成为现代计算机科学分支的,则是1995年罗莎琳·皮卡德发表的关于情感计算的论文。人们研究情感计算很大程度上是为了能够模拟共情——机器应该能够解释人类的情绪状态,做出相适应的行为,对情绪给予恰当的回应。
情感AI技术的基础在于心理学层面的情感识别分析技术,在该技术出现前,人类的情感只能用语言去描述,属于纯粹主观经验判断。而情感识别和量化技术由美国心理学家保罗·艾克曼教授创立,其最大的学术贡献是面部动作编码系统(FACS)[2]。通过该技术,人类第一次可以通过科学标记计量的方法将高兴、伤心、害怕、愤怒、厌恶、惊讶、轻蔑等七种基本情绪进行科学定性定量分析。
技术实现
尽管人类目前可能在情感识别方面占上风,但是机器正在利用自己的优势在不断进步。麻省理工学院斯隆(MIT Sloan)教授Erik Brynjolfsson解释说,机器非常擅长分析大量数据,他们可以聆听声音变化,并开始识别这些变化与情绪变化的关系。同时机器可以分析图像并在人类面部微表情中识别出细微之处,速度比人类甚至还要快[3]。
情感AI现在主要通过视频、 声音和文本展开。
-
视频或图片的情感AI主要通过深度神经网络训练模型然后进行情感预测。
人类的表情丰富多样,种类大致有7类,但微表情种类则异常丰富,主要表情+微表情可以很好的反映受试者的情感状态即变化。
比如下图,预测结果:最有可能:安静,次之: 高兴。
人类处理声音的方式异常复杂,从音频剪辑中感知情感的方式涉及很多因素。一个人的性别,其语气变化,甚至所用词语的类型都会影响我们理解所说内容的方式。
梅尔频率倒谱[4](MFC)是数据的短期功率谱,对语音分析特别有用。人发出的声音会受到声道形状(包括声带,喉,舌头,牙齿等)的影响。从最基本的意义上说,梅尔频率倒谱在数字上代表了这种声音通道。梅尔音阶的目的是模仿低频的人耳对声音的感知,方法是在较低频率下更具判别力,而在较高频率下则具有较少判别力。它可以缩放频率,使其与人耳听到的声音紧密匹配(人类更擅长识别低频下语音的细微变化)。
-
对于文本级别的情感AI分析,一般采用的是文本情感分析
文本情感分析[5](也称为意见挖掘)是指用自然语言处理、文本挖掘以及计算机语言学等方法来识别和提取原素材中的主观信息。通常来说,情感分析的目的是为了找出说话者/作者在某些话题上或者针对一个文本两极的观点的态度。这个态度或许是他或她的个人判断或是评估,也许是他当时的情感状态(就是说,作者在做出这个言论时的情绪状态),或是作者有意向的情感交流(就是作者想要读者所体验的情绪)。
十多年来,一些大公司以及规模较小的初创公司已经在情感AI方面进行了投资,它使用计算机视觉或语音分析来识别人类情感。这些公司中的许多公司开始专注于市场研究,抓取和分析人类对产品反应。其中一些进展包括:
-
医学诊断。该软件可以通过语音分析帮助医生诊断诸如抑郁症和痴呆症等疾病。
其中2018年一项研究[6],对来自30名来自不同文化背景下的儿童视频研究,通过深度学习对于视频的处理,对于自闭症儿童的个体和文化差异的影响进行了实证研究,为自闭症的进一步研究提供了数据基础。
-
员工安全。情绪AI可以帮助分析工作量很大的员工(例如急救人员)的压力和焦虑程度。
位于阿姆斯特丹的Koninklijke Philips Electronics NV和ABN AMRO Bank NV开发的技术[7],目的降低金融市场的交易风险。研究表明,处于情绪高涨状态的交易者将为资产和轻描淡写的风险支付过多的费用,这种情况被称为“竞价热”或“竞标狂潮”。为了解决这个问题,两家公司共同开发了一种称为Rationalizer的工具,该工具具有两个部分:连接在交易者手腕上的手环,该手环通过皮肤电活动(类似于测谎仪的工作方式)来测量情绪,而显示屏则显示手腕的力量。研究人员发现,当用户意识到自己情绪高涨时,他们更有可能重新考虑自己的决定。
-
视频游戏。游戏机/视频游戏使用计算机视觉,在游戏过程中通过面部表情检测情绪并适应性调整。
Facebook的“情绪检测自拍滤镜”专利,这个想法是根据照片中检测到的情绪自动选择合适的自拍“面具”。例如,如果自拍者看起来很悲伤,则过滤器默认为卡通泪滴;如果看起来很开心则会得到“Happy Panda”。
-
教育。已经开发了学习软件原型以适应孩子的情绪。当孩子由于一项任务太困难或太简单而感到沮丧时,该程序会适应该任务,从而使任务变得或多或少。
-
病人护理。“护士机器人”不仅提醒长期医疗计划中的老年患者服用药物,而且每天与他们交谈以监控他们的总体健康状况。
-
汽车安全。汽车销售商可以使用计算机视觉技术来监视驾驶员的情绪状态。极端的情绪状态或嗜睡可能会触发驾驶员警报。
-
自动驾驶汽车。未来,自动驾驶汽车的内部将配备许多传感器,包括摄像头和麦克风,以监视发生的情况并了解用户驾驶体验的反馈。
-
欺诈识别。保险公司使用语音分析来检测客户在提交索赔时是否在说真话。根据独立调查,高达30%的用户承认向其汽车保险公司撒谎以获取保险。
-
呼叫中心智能路由。可以从一开始就发现生气的客户,并将其路由到训练有素的业务代表,后者还可以实时监控对话的进行和调整。
-
公共服务。情感AI技术供应商和监控摄像头提供商之间已经建立了合作关系。阿拉伯联合酋长国公共场所的摄像机可以检测人们的面部表情,因此可以了解人们的总体情绪。
-
零售。零售商已开始研究在商店中安装计算机视觉情感AI技术,以获取人口统计信息以及访客的情绪和反应。
现在情感AI已经慢慢渗透到我们生活的方方面面了,虽然可能我们感知不到,但它实实在在的在帮助我们构建一个更安全,更友好,更intelligent的世界,现在的应用大多数只是基于单个数据维度,未来融合技术对于情感AI或是一个契机。
1.https://zh.wikipedia.org/wiki/%E6%83%85%E6%84%9F%E8%AE%A1%E7%AE%97
2.https://mitpress.mit.edu/books/affective-computing
3.https://mitsloan.mit.edu/ideas-made-to-matter/emotion-ai-explained
4.https://zh.wikipedia.org/zh/%E6%A2%85%E5%B0%94%E9%A2%91%E7%8E%87%E5%80%92%E8%B0%B1%E7%B3%BB%E6%95%B0
5.https://zh.wikipedia.org/wiki/%E6%96%87%E6%9C%AC%E6%83%85%E6%84%9F%E5%88%86%E6%9E%90
6.https://www.media.mit.edu/publications/culturenet-a-deep-learning-approach-for-engagement-intensity-estimation-from-face-images-of-children-with-autism/
7.https://sloanreview.mit.edu/article/how-emotion-sensing-technology-can-reshape-the-workplace/