AI TIME欢迎每一位AI爱好者的加入!
6月21日,由北京智源人工智能研究院主办的2020北京智源大会成功开幕,来自世界人工智能领域的中外顶尖学者专家通过视频在“云上”相聚,共同探讨人工智能前沿问题、畅想AI发展的下一个十年。在下午“AI科技女性”专题论坛上,5位女科学家就科技女性这一话题发表自己的见解,展现了榜样的力量。其中,哈尔滨工业大学、AI 2000上榜学者秦兵教授做了名为《打开人工智能情感之门》的主题演讲。
本次秦教授的演讲从两个维度出发,技术和感悟。技术方面,介绍了什么是情感计算,情感计算都面临哪些挑战,如何解决这些挑战以及情感计算的应用与发展趋势。感悟方面,主要跟专题内容相关,通过数据、模型的独特视角对科研女性进行解读。以下为秦教授演讲的内容概要,供读者学习。
一、学术:赋予计算机情感计算能力
人工智能的学术方面,秦教授的研究主要有三个部分:情感的计算、知识图谱构建与应用、文本生成。本次报告,主要围绕计算机情感计算展开。
从一部电影说起。电影《她》讲述了在不远的未来人与人工智能相爱的科幻爱情电影。人与机器人坠入爱河,在现在好像不太现实,但或许未来将不是科幻。如何赋予计算机情感计算能力,是当前学术界和企业界研究的一大热点问题。
人类情感与机器情感。情感是什么?心理学大辞典中最初始的定义,所谓情感是人对客观事物是否满足自己的需要而产生的态度体验,包含了丰富的主观情绪和感受。在人工情感问题上,人工智能之父MINSKY在1985年曾说到“问题不在于智能机器能否拥有任何情感,而在于机器实现智能时怎么能够没有情感”。机器的情感计算,是指机器理解人类情感以及生成情感的能力。不仅需要它在跟人类进行交互过程中,理解人类的情感,知道人类的喜怒哀乐,同时还要有自己的情感。
机器的“类人”语言能力。机器的“类人”语言能力体现为理性与感性兼备,一是理解与推理能力,二是情感与表达能力,这就需要语篇理解与推理、情感语义计算技术的支持,其背后蕴藏着众多待解决的科学问题。
从机器的类人语言能力角度,机器智能可概括为计算智能、感知智能和认知智能三类。计算智能,相比人类,计算机的先天优势在于强大的存储能力和计算能力。感知智能,在语音识别、图象识别等任务上,计算机可以和人类相媲美。认知智能,体现的是认知能力,这方面机器和人相比还存在一定的差距。
秦教授强调认知能力主要体现在理性和感性上,分别是具备理解和思考的理性能力与具备情感识别和生成的感性能力。具体来说理解和思考的能力,是对于给定的一个现象或事物,机器能否准确理解,从而做出有效推理。情感识别与生成能力,是指当人在倾述某种感情时,机器是否能够理解用户此刻的心情,评价某一个产品、某一个服务,或某一项指标时,机器能否判断褒义还是贬义。
情感计算与人工智能。情感计算是重要的技术支撑,它与人工智能情感机器人的目的在于对人类特有情感的模仿和超越,但与现有人工智能技术的高度发展相比,人工情感技术所取得的进展还略显薄弱。情感始终是横跨在人脑和电脑之间一条无法逾越的鸿沟。
情感计算。现在人工智能在不断进步,情感计算的使命是赋予其情感和温度,这是一个有趣且具有挑战的问题。网络评论、博客、微博、社交媒体的文本中,蕴含大量的情感和情绪,情感计算的任务是利用计算的方法对这些情感、情绪进行挖掘。情感计算不仅是自然语言处理领域的一个研究方向,也是计算机科学、管理科学和社会科学的交叉融合。那么,情感计算的研究都有哪些挑战?秦兵教授总结了以下五点:
挑战一:
情感词汇的歧义性
图1 情感词汇的歧义性
歧义性,图1中同样一个词“快”,在不同语境下有不同的语义,确定词的具体语义需要结合上下文进行分析。
挑战二:
情感表达的含蓄性
图2 情感表达的含蓄性
“澎湃壮观的爱琴海,洁净蔚蓝的天空,此乃西方文明的摇篮”,表面看来是对事实的描述,没有任何情感词汇,实际则在抒发赞美之情。传统的情感分析方法多依赖显式情感词,社交媒体中大量存在的隐式情感表达处理上还存在一定难度。
挑战三:
情感可解释性
图3 情感可解释性
深度理解情感,不仅要理解人们表达了什么情感,更要理解情感产生的原因。伤心的原因是考试考砸了,高兴的原因是收到理想大学的通知。在研究情感类别的时候,除了要知道当时的状态,还要知道其原因,正所谓知其然也要知其所以然。
挑战四:
情感表达一致性
图4 情感表达一致性
情感表达一致性是指系统分析得到的情感应该与实际表达保持一致,并能做出正确回应。在图4的对话中,系统需要识别用户的情绪,并做出相应的回复。若识别出的情绪不太好,要怎么鼓励或者安慰他。但是如果系统不具备正确识别的能力,没有生成符合情感语境下的回复,可能就会答非所问,导致用户的失望。
挑战五:
情感表达的多模态性
图5 情感表达的多模态性
情感表达是具有多模态性的,只考虑文本,有时无法准确的判断出人们实际所表达的情感。比如说“这次聚会棒极了”,如果只看文字会认为是在表扬,但是实际则在翻白眼,音调也是拉长的。因此在同时具有语调或者表情的信息时,对文本情感的识别可能会更为准确。
针对以上五个挑战,目前也有一些相应技术,以提高情感计算的准确性。
情感词汇语义表示
图6 情感词汇语义表示
基于深度神经网络的表示学习在文本情感分析中具有重大理论创新的潜在空间。像开心和高兴字面上没有交集,通过神经网络表示学习可以把这些意思相近的词汇聚在一起。但其存在一个问题,会使上下文相近但情感极性相反的词语被映射到相近的词向量上,比如图6中的好和坏,上下文非常相似,但情感极性相反。最后导致在情感分析里,“好”和“坏”的词向量语义表示非常接近。秦教授学生2014年发表在ACL上的文章中提出了融合文本情感极性的词向量学习算法,很好的解决了这个问题,得到学术界广泛认可。
隐式情感分析
图7 隐式情感分析
隐式情感分析,主要针对情感表达的含蓄性。对于类似“西方文明的摇篮”、“桌子上一层灰”的隐式表达,首先对情感主体进行识别,抽取其情感表达,再建立情感主体关系模型。
情感原因发现和预测
情感的可解释性,即情感原因发现和预测,需要从多个维度进行考核,结合更多的元素。在产生一个用户评论时,除了结合社会焦点事件,有的时候还要考虑其所在的群体。所在群体不同,持有的观点不同。将事件本身的表示文本,用户的评论文本,用户行为特征聚集起来,共同成为一个情感的表示,进行原因的发现和预测,可达到更好的可解释性。
情感原因发现和预测
图8 情感生成
情感生成的一致性,比如情感评论生成,根据用户、产品和评分生成具体相应情感的评论。又比如情感回复的生成,文本“爱狗又会做饭的男生太可爱了”+ 情感“生气”,最后给出相应的结果。情感生成是可以指定的,只需在生成机制里给出情感类别。
多模态情感表示与识别
图9 多模态情感识别
输入一段视频可以输出其对应的情感标签,比如图9,将视频图象、文本图象和声音的信号集中到一起,在某一个时间段,根据描写的词、音调以及图片情况,对情感进行判别。使用时,可以通过矩阵的方式直接拼接多模态各个通道的向量进行融合,也可以采用更复杂的方法进行融合。由于深度学习的发展,目前多模态的研究越来越多。
情感分析技术应用
在商品/服务评论分析方面,对评价对象和评价表达进行抽取,识别评论中的情感倾向性,可辅助消费者挑选产品以及指导商家改进商品/服务。在舆情分析方面,对热点事件中的情绪进行剖析,寻找情感原因。在情感对话方面,情感机器人(虚拟&实体)可用于体恤明情,抚慰心灵,充当情感陪护。
图10 情感分析技术应用
根据以上分析,总结未来情感计算发展的五个趋势:
第一从显式情感分析到隐式情感分析,深入挖掘情感的语义。
第二从单模态大多模态的情感分析,引起了多领域学者关注。
第三从特意领域到多领域的迁移,推动跨领域情感分析的研究。
第四从情感分析到情感生成,让机器人产生情感。
第五从研究到应用,情感计算部分的成熟技术在更多行业应用落地。
二、感悟:模型趣解科研女性
说完技术,再来谈谈对“科技女性”的感悟,看秦教授如何用模型趣解科研女性。
人类与科技。男性+科技等于科技伟人,男科学家有很多。然而女性+科技等于科技女性,虽然也有一些有名的女科学家,例如屠呦呦等,但比例来讲显然不如男性。
机器视角:女性与科学研究。语言模型是计算一个句子概率大小的统计模型。从机器视角看科技女性,在GPT2语言模型下,对于女性理想的职业是什么?GPT2生成的是Nurse,而男性则是Artisan和Farmer,可见男女职业是有区别的。
偏见还是偏置?从事科研工作女性比较少,是偏见还是偏置?偏见的一种心理,比如女司机、女博士。偏置是数据统计的一种现象,比如统计网络数据,但网络上年轻人居多,又比如统计男女比例,但工科院校女生少。
不同阶段的男女比例。全国总人口男女比例大约为1.05:1。工科院校,以某个工科学校为例,本科生男女比例为5:1,研究生男女比例4:1,教师男女比例5.5:1,教授男女比例是4:1。显然,在工科领域男女比例上存在明显差异。
模型趣解。从上述可以发现,很多角度下,男女都是存在区别的。那么通过模型可以有哪些分析?
图11 二分类模型
通过逻辑回归模型的二分类模型研究在特征的权重以及个人的特征的影响下,成为一个科研人员的可能性。根据样例数据得出权重,分析在权重固定的情况下怎么样优化个人特征。模型设计了一组科研领域特征纬度,假设固定权重男性占比80%,女性占比20%,问题在于如何通过其他特征使自己更加匹配,增大可能性。
图12 一个例子
以某一科研女性小红为例,其各项特征值如图12。用逻辑回归计算,要使Y增大,一是特征权重,二是个人特征。由于之前的偏见观念,自身不擅长这个领域以及家庭负担等,女性的固定特征权重很低(W=0.2)。剩下的选择是提高X,增加自己的技能,优化个人特征。所以在科研领域,一些女性特征相对弱势,需要花费更多的精力增强其它特征。
图13 Stack-propagation模型
如何在工作和生活中进行平衡,或许通过Stack-propagation模型可以得到一些启发。一个人同时忙工作和忙生活要付出很多,采用这个模型可以借力,管理一个家庭或某些问题上的经验,可以应用到工作中,工作当中一些经验方法可以反馈到家庭事务管理。通过多任务学习的框架思想,协调处理工作和家庭关系,使工作和家庭相互促进,都能得以提高。
结语
本次秦教授的演讲围绕“智能、情感、女性”三个关键词展开,演讲内容不仅有技术,更有温度。赋予计算机情感是一个充满魅力的学术研究问题,在秦教授的分享中我们不仅领略了计算机的情感世界,也对科研女性从新的视角有了新的感悟。人工智能飞速发展,改变着我们的时代,但这一切都应以生活为出发点,正如秦教授最后所说的一样“为机器赋予语言或情感的智能,让生活更加美丽”。