点击上方“中国计算机学会”轻松订阅!
来源:《中国计算机学会通讯》2017年第9期《专题》
学术界和工业界越来越重视人机对话。在研究上,大数据和深度学习共同推动了自然语言理解技术的发展,以阅读理解为代表的任务将自然语言理解引向深入。其中,对话管理经历了由规则到有指导学习再到强化学习的发展过程,自然语言生成则从模板生成、句子规划,发展为端到端的深度学习模型。在应用上,基于人机对话技术的产品层出不穷,人们耳熟能详的有苹果公司的Siri1、亚马逊的Echo2音箱、微软的Cortana3、脸书的 M4以及谷歌的Allo5等。同时,各大企业也纷纷研发或收购AI平台,如微软研发的语言理解智能服务(Luis.ai),如三星、脸书和谷歌分别收购了Viv.ai、Wit.ai和api.ai,如百度研发的DuerOS以及收购的kitt.ai。从各大企业对人机对话技术的高度重视来看,未来的竞争将会何等激烈。
总体上看,人机对话系统经历了语音助手、聊天机器人和面向场景的任务执行三个阶段。语音助手的典型代表是苹果设备中的Siri。语音助手目前的各项技术尚未成熟,还达不到用户的期望值。如“听见了”但“听不懂”,以至于“严肃”用途失效,“调戏”方式盛行。同时,语音助手往往需要私密的环境。在这种情况下,文字交互反而更有优势,如果有图像交互界面的配合,效果更好。2014年,微软发布了聊天机器人小冰,其特点是从实用化转向娱乐化,降低了用户期望值,直接采用文字沟通。虽然深度学习技术被充分运用,技术水平有所提高,但也面临对语境建模和对机器人自身建模的技术问题,以及如何保持用户活跃度等实际应用问题。因而,人机对话系统应用的总体趋势是通过聊天建立人与机器之间的信任,在聊天中对用户进行画像,进而满足后续的场景化任务执行需求。当前的主要问题是,在聊天时,如何能让机器人更像人,以及在场景化任务执行中如何做到高效的场景切换。
通过本期专题的6篇文章,我们将对人机对话技术的现状及发展趋势进行全方位的介绍,包括人机对话系统四个方面的功能,即聊天、知识问答、任务执行和信息推荐,还包括口语对话系统中的认知智能、特定情感的对话文本生成以及开放域和任务型对话系统的评价。
哈尔滨工业大学车万翔副教授和张宇教授共同撰写的文章《任务型与问答型对话系统中的语言理解技术》,介绍了语义理解、意图分类以及槽识别及填充等任务型对话系统中的关键技术,介绍了当前可用于研究的数据集和开放对话系统服务平台。
微软亚洲研究院武威研究员和常务副院长周明研究员共同撰写的文章《聊天机器人的技术及展望》,以微软小冰为例,详细阐述了聊天机器人的诞生背景、技术发展过程以及未来的趋势和挑战。
清华大学黄民烈副教授和朱小燕教授共同撰写的文章《人机对话中的情绪感知与表达》,系统性地阐述了对话中情感因素的重要性,给出了情绪化内容生成的总体框架,分析了对话中的情感交互模式。
北京智能一点科技有限公司CEO胡云华撰写的文章《对话式交互与个性化推荐》,从对话式交互方式(CUI)流行的原因开始分析,进而提出了对话式交互的概念,并且通过对比图形用户界面(GUI)与CUI之间的差异,阐述了个性化推荐在CUI中的优势。
上海交通大学俞凯教授撰写的文章《对话智能与认知型口语交互界面》,系统全面地分析了口语对话系统中的对话智能和认知计算所面临的技术挑战,以及现实应用场景中口语对话系统的挑战,最终将其归纳为“交互控制”和“非精确信息处理”两个核心问题。
哈尔滨工业大学张伟男博士和车万翔副教授共同撰写的文章《对话系统评价技术进展及展望》,详细分析了开放域对话(聊天)与任务型对话的评价方法现状,在综合分析各种评价方法优缺点的基础上,展望了对话评价的发展趋势。
脚注:
1苹果智能语音助手。Siri是苹果公司在其产品iPhone4S,iPad 3及以上版本手机和Mac上应用的一项智能语音控制功能。Siri可以变身为一台智能化机器人,用户可以通过Siri读短信、介绍餐厅、询问天气、设置闹钟等。Siri支持自然语言输入,可以调用系统自带的天气预报、日程安排、搜索资料等应用,还能够不断学习新的声音和语调,提供对话式的应答。
2亚马逊智能音箱。Echo是2014年亚马逊推出的一款全新概念的智能音箱。这款产品的最大亮点是将智能语音交互技术植入到传统音箱中,从而赋予音箱人工智能属性。
3微软小娜。Cortana是微软公司发布的全球第一款个人智能助理。能够了解用户的喜好和习惯,帮助用户进行日程安排、问题回答等。Cortana 是微软在机器学习和人工智能领域方面的尝试。
4“M”即Messenger,是Facebook打造的虚拟助手。用户可以向M虚拟助手提出任何问题,而不仅仅是该系统设置好的能够回答的问题。它有培训设置,最终帮助用户完成更多的事务。
5Allo是谷歌2016年推出的一款基于谷歌联系人之间的即时通信类App。这一产品主打人工智能以及“谷歌助手”(Google Assistant),和传统聊天工具差异明显。在Allo上,“人工智能”可以帮助你聊天,能自动为你推送一些常用的回答方式,用户直接选择其一就可以实现“懒人聊天”了。
特邀编辑:
刘挺
CCF理事、CCF哈尔滨主席、CCCF前译文栏目主编。哈尔滨工业大学教授、社会计算与信息检索研究中心主任。曾任顶级国际会议ACL、EMNLP领域主席。研究方向:自然语言处理和社会计算。
tliu72@foxmail.com
张伟男
CCF专业会员。哈尔滨工业大学讲师。研究方向:人机对话与自然语言处理。
wnzhang@ir.hit.edu.cn
更多《中国计算机学会通讯》精彩文章,请点击【阅读原文】