9 月 16 日,于杭州浙江东方豪生大酒店,一群先行者们由幕后走到台前,他们来自阿里、亚马逊、竹间、科大讯飞、华为、京东等,一面总结自身经验与踩过的一个个坑,一面将全球最前沿的技术风向分享给听众。竹间智能CTO翁嘉颀在自然语言处理分会场上,指出人机交互的下一步将是打造主动式及对话式机器人,而实现的技术正是竹间不断精心打磨的情感计算与自然语言理解。
分会场:自然语言处理NLP
主讲者:竹间智能CTO翁嘉颀
主题:人机交互的下一步—主动式、对话式
人机交互的发展
人机交互并非近年才存在,过去,人机交互依靠指令式进行,从三十年前DOS时代一行行的指令,渐渐到Windows的鼠标,再至手机、平板的触控式屏幕,由于这些交互设备的特性,使得关键词模版得以回应使用者。然而其带来的劣势也显而易见,因只能接受固定命令,因此无法提升机器能力,在无法识别用户情绪下,也难以理解用户,遑论拥有用户记忆。
随着时代发展,当未来交互设备变为手环、耳机、音箱时,人机交互将回归至人类最原始的语音交互方式,要使用语音交互就要做自然语言理解。自然语言理解于过去遇到瓶颈,直到深度学习、机器学习出来后才有一点突破。在结合自然语言理解,深度学习及机器学习后,逐渐能以语义理解来识别用户意图,了解对话主题,话语的记忆及情绪,进而慢慢达到更精确的回复。
但截至目前为止,想让机器做到类似人的地步,除了意图理解,NLP(Natural Language Processing)及NLU(Natural Language Understanding)以外,还要做到情绪、情感,乃至整个情境的分析。
情感计算
竹间名字叫EMOTIBOT,即Emotional加上Robot,意谓着带有情感的机器人。情感计算在人机交互中占有何种地位?当我们和他人在沟通时,单靠文字其实难以真正判读情绪,若通过文字加语音,起码能有更多把握,当文字、语音和表情共同出现时,便能大致掌握对方情绪。因此,竹间目前做了4种语音情绪,9种人脸表情及22种文字情绪。通过将语音情绪、人脸表情及文字情绪加总的多模态情感计算,使机器能做到理解用户情绪进而提升人机交互体验。
聊天机器人
而在情绪情感识别后,还需要什么才能做出好的聊天机器人?关于好的聊天机器人,首要离不开功能和技能性,然而在看似平常简单的对话中,若机器人缺乏知识图谱、对话主题、上下文理解和长短时记忆,在和用户的对话中依然无法给予精确回复。
以对话主题而言,对话主题通常具有阶层关系。例如问“你喜欢英超哪支球队?”,它的主题阶层为运动→足球→五大联赛→英超,若回答“我喜欢巴萨”,主题阶层为运动→足球→五大联赛→西甲,虽然并不完全符合,但也差距不大。但若是回答“其实我喜欢看NBA”,对话主题已偏离足球,但也还在运动范畴内。如果回答“我喜欢吃蛋炒饭”,就完全不行,因最大阶层的运动这一主题都完全不符合。
因此,如果机器人拥有长短时记忆及上下文理解,它可能有机会在对话无法继续时主动跳转主题来引导话题。根据这样的能力以及用户画像,机器人不再被动,反而能做到主动式推荐。
NLU的重要性
想做到好的对话式机器人,基础的核心在于NLU(自然语言理解)上。通过中文分词、词性标注、关键词、言外行为、人称实体、句式识别等,机器才能精准抓住对话主题及用户意图。例如“我在黄埔江边”,中文分词既能分成“黄埔”和“江边”,也能分为“黄浦江”和“边”,分词是一切东西的根本,分词一旦分错,后面意图理解也会不同。
人机交互下一步——主动式、对话式
因此,人机交互的下一步是什么?
目前的数据中,用户在和机器人有效对话后,67%用户因为答案看不懂转人工,25%用户问了机器人不会的新问题转人工,8%的用户决定决定转人工是因为算法匹配错误。因此即使将算法做到完美,也只解决了8%的问题。当下所需要的交互方式应该是以对话、主动的方式才能有效解决用户问题。
竹间以NLP、深度学习及机器学习等技术,通过结合用户画像和多轮对话,在场景中为用户进行商品或服务推荐。在目前落地项目中,竹间已做到夏普时尚之星、万达百货AR交互、可口可乐快闪店以及苏宁BIU店等。
关于竹间智能(EMOTIBOT)
竹间智能由前微软互联网工程院副院长简仁贤先生创办,致力于利用深度学习、中文自然语言理解、情感计算、计算机视觉等技术,研发带有情感识别能力的对话机器人及行业解决方案。现已有AI智能客服、金融机器人、导购机器人、呼叫中心等行业解决方案。
目前,包括交通银行、招商银行、民生银行、平安集团、兴业证券、苏宁、富士康集团、台湾夏普、优必选,唯品会、中国移动等在内的众多企业,已经采用竹间的智能客服、金融机器人、导购机器人等行业解决方案,大幅提升客服效率与用户体验,并从用户对话大数据中取得丰富的业务洞察。
点击阅读原文,体验竹间对话机器人