独家 | 清华黄民烈:人机对话的典型技术、面临挑战和发展方向

2017 年 11 月 16 日 THU数据派 黄民烈


在近期举办的“数据科学家成长之道”论坛上,清华大学计算机科学与技术系副教授黄民烈做了题为《人机对话》的演讲,通过探讨人机对话的典型技术、交互范式、所面临的挑战及所带来的价值,了解人机交互中的认知、情感捕捉,以洞察人机对话的未来方向。


后台回复关键词“1028”,下载完整版PPT


黄民烈,清华大学科学与技术系副教授,清华大学工学博士。研究兴趣主要集中在深度学习、机器学习应用、自然语言处理、自动问答、人机对话、情感分析等。


演讲内容精华经数据派整理如下:


人机对话研究怎么让计算机跟人一样自如交谈。在场的老师和同学大多都用过“小冰”,由于背后充足的技术、团队和资金支撑,它在对话方面做得就很不错,但是事实上它还存在诸多的问题,比如一致性、身份个性等。由此你可以看到这样一个非常具有挑战性的问题,有些人说倘若把人工智能比喻为“皇冠”,皇冠的明珠就是自然语言处理,而明珠中最亮的那颗,就是人机对话。



讲人机对话可以追溯到图灵测试。如果能通过图灵测试,就认为这个机器具备跟人一样的智能。IBM Watson知识问答的系统,在当时引起很大的轰动,后来其被用于各个行业。


人机对话是一种新的人机接口,通过语音可以实现跟智能系统的有效交互。所以我们知道人机对话是新的范式的转变。在传统计算机的鼠标键盘,手机的触控就是很便捷的人跟机器的交互方式。比如微软在做的一个CAAP,把语音作为跟机器对话的一个基本的接口,将来的APP就隐藏到后台去了,我们可以通过语言理解方面去完成我们想要做的一些事情。


我们可以回顾一下虚拟的对话机器人,可以通过文字输入、输出,或者语音输入、输出的一个机器人,存在于网络世界而没有实体。从Eliza(做心理咨询的)到ALICE到QQ聊天机器人、小冰。还有很多实体机器人,比如说情感机器人Pepper,它是一个人形机器人,有一定的情感识别和表达能力,包括MIT的Jibo可以在家庭里执行一定任务,这些机器人可以进行一定的助理工作,同时还可以跟家庭成员进行一个有效的互动。


这样一些对话机器人真正进入到千家万户是一个非常难以解决的问题,具体体现在以下两个方面。第一,要真正理解它的语意很难。第二,它的逻辑非常重要。你对话的时候,有很多常识的问题、逻辑上的问题怎么样去解决?包括一致性的问题,交互性的问题,而你在交互过程中怎么能跟用户有很好的互动、情感的理解,也是研究里的一些重点。其中涉及到你怎么生成高质量的答复,我们前面演讲说判断一个文章是人还是机器写的,对话里也面临这个问题:怎么给它一个身份、个性、人格,包括怎么样去理解和表达情感,包括怎么样去主动跟机器进行对答,不仅仅是被动的应答。    



这是一个深度学习的模型,在微博上面训练出来的。当人们说话的时候,机器可以答复出来。它要真正做到深刻理解是非常困难的事情。另外,没有固定的身份和人格也是很大的问题。这里边有两类基本的技术,一个是基于检索的技术,需要一个很大的数据库,存储一些问题和答案。当新出现一个问题时,去这个库检索一个跟它最接近的问题,把那个问题的答案作为新问题答案的返回。


我们做的工作分布在几个方面,其中一个是怎么样让机器人表达情感和感知。比如说MIT在1997年提出来的情感计算,以及心理学研究中情绪的智能。它是一种很重要的人类的智能行为,而它要能够很好地去表达情绪上的响应。在某种程度上,这就是情商的一方面。


在情绪类感知和表达部分,我们研究了怎么样在语音语调上感知。比如你不高兴的时候你会怎么说话,你很开心时候怎么说话。另一方面通过你的面部表情,比如皱眉、或者开心的笑。我们做的是怎么样在文字上表达它的情感,是比前面要更加隐讳的一个表达方式。其中一个方法是从微博里面抓取微博互动的数据,利用标注数据训练一个情绪的分类器,这个情绪分类器会把数据标记为喜怒哀乐的类别,然后把这些数据送到深度学习生成模型里面。



我们在这里面考虑三个方面的因素:第一,把情绪类别编码成一个向量,可以用记忆网络建模情感内部状态的变化;另外,可以对情感表达进行一个显性的选择,生成一般意义的词。


另外我们在机器人身份上、个性嵌入上做了工作。假设我们机器人确定一个身份,它就是一个三岁小男孩儿,喜欢动漫又能弹钢琴,这样的人设下能不能够生成一个很好的答复,跟他的身份一致的答复?这个问题很有挑战,你没有足够的数据去训练这样的模型。我们是用海量微博互动的数据。这种情况下你应该用人设的数据来回答问题,并且根据这个人设资料进行很好的答复生成。

   


人机对话的未来方向,比如怎么去做类人机器人,你如何教会机器人学习记忆的时候,也在不断累积它的知识,这是很有意思和挑战的事。


后台回复关键词“1028”,下载完整版PPT


“数据科学家成长之道”论坛

“数据科学家成长之道”论坛由清数大数据产业联盟(原清华大数据产业联合会),清华校友AI大数据专委会(筹)联合中关村大数据产业联盟、DF数据竞赛平台(Data Fountain ,DF)、首席数据科学家俱乐部(Chief Data Scientist Club, CDSC)等组织联合举办,意在为社会输出大量高质量大数据和人工智能人才,为国家实现DT时代的强国梦贡献力量。

整理:王志蒙

编辑:文婧

校对:丁楠雅

为保证发文质量、树立口碑,数据派现设立“错别字基金”,鼓励读者积极纠错

若您在阅读文章过程中发现任何错误,请在文末留言,或到后台反馈,经小编确认后,数据派将向检举读者发8.8元红包

同一位读者指出同一篇文章多处错误,奖金不变。不同读者指出同一处错误,奖励第一位读者。

感谢一直以来您的关注和支持,希望您能够监督数据派产出更加高质的内容。

登录查看更多
0

相关内容

人机对话,是人工智能领域的一个子方向,通俗的讲就是让人可以通过人类的语言(即自然语言)与计算机进行交互。作为人工智能的终极难题之一,一个完整的人机对话系统涉及到的技术极为广泛,例如计算机科学中的语音技术,自然语言处理,机器学习,规划与推理,知识工程,甚至语言学和认知科学中的许多理论在人机对话中都有所应用。
【新加坡国立大学】深度学习时代数据库:挑战与机会
专知会员服务
33+阅读 · 2020年3月6日
2019->2020必看的十篇「深度学习领域综述」论文
专知会员服务
270+阅读 · 2020年1月1日
2019中国硬科技发展白皮书 193页
专知会员服务
81+阅读 · 2019年12月13日
[综述]基于深度学习的开放领域对话系统研究综述
专知会员服务
78+阅读 · 2019年10月12日
陶建华、杨明浩谈多模态人机对话:交互式学习能力愈发重要
中国科学院自动化研究所
31+阅读 · 2019年7月17日
SMP2018中文人机对话技术评测
哈工大SCIR
12+阅读 · 2019年3月6日
人机交互如何改变人类生活 | 公开课笔记
人工智能头条
4+阅读 · 2018年7月9日
【NLP】周明:自然语言对话引擎
产业智能官
6+阅读 · 2017年10月19日
刘挺 张伟男 | 人机对话
中国计算机学会
7+阅读 · 2017年9月19日
论文动态 | 基于知识图谱的问答系统关键技术研究 #01
开放知识图谱
16+阅读 · 2017年8月3日
Factor Graph Attention
Arxiv
6+阅读 · 2019年4月11日
Arxiv
26+阅读 · 2019年3月5日
Arxiv
136+阅读 · 2018年10月8日
Arxiv
11+阅读 · 2018年4月25日
VIP会员
相关资讯
陶建华、杨明浩谈多模态人机对话:交互式学习能力愈发重要
中国科学院自动化研究所
31+阅读 · 2019年7月17日
SMP2018中文人机对话技术评测
哈工大SCIR
12+阅读 · 2019年3月6日
人机交互如何改变人类生活 | 公开课笔记
人工智能头条
4+阅读 · 2018年7月9日
【NLP】周明:自然语言对话引擎
产业智能官
6+阅读 · 2017年10月19日
刘挺 张伟男 | 人机对话
中国计算机学会
7+阅读 · 2017年9月19日
论文动态 | 基于知识图谱的问答系统关键技术研究 #01
开放知识图谱
16+阅读 · 2017年8月3日
相关论文
Top
微信扫码咨询专知VIP会员