全球顶尖科学杂志:阿里AI语音技术超越谷歌,可读懂人类潜藏意图

2018 年 12 月 19 日 算法与数学之美

阿里巴巴近日一项在国际顶级学术会议上的AI语音技术演示,引起业界轰动。权威科学杂志《麻省理工科技评论》认为,阿里巴巴的AI语音助手可以完成复杂的人类对话功能,甚至可读懂人类的潜在意图,显示出阿里巴巴已经拥有比谷歌更好的AI语音技术。

(《麻省理工科技评论》近日报道截图)


不久前,阿里巴巴达摩院的科学家在机器学习领域顶级会议NIPS(神经信息处理系统大会)上,演示了这项已应用于快递领域的AI语音技术。在约30秒的时间里,菜鸟语音助手在经历了被用户打断、更改意图、沉默等交互后,依然能够应对自如,顺利帮助用户完成了快递派送地址的更改。


今年5月份,谷歌曾发布一款酷似人类的的语音助手Duplex,可以帮助客户预定餐厅。这在业界引起了不小的关注。


但《麻省理工科技评论》认为,阿里巴巴演示中发生的一幕,揭开了人机语音交互的新序幕:当AI问用户明天早上是否可以派送时,用户回答“我早上不在家”,阿里巴巴的AI语音助手没有直接回答“是”或“否”,而是读出人类背后潜藏的意图,并采取后续行动。


“类似表达在人类对话中可能非常普遍,但机器往往很难对其进行处理。从演示的效果来看,阿里巴巴的AI语音助手能够做到这一点,说明它比谷歌更高级。”《麻省理工科技评论》认为,这显示出阿里巴巴在AI语音领域的技术能力已经超出谷歌。《麻省理工科技评论》是全球影响力最大、最权威的科技杂志之一。


此外,阿里巴巴的语音助手能让机器在跟人交互过程中既能"说"又能"听",并能模仿真人的语气、语调、语速,整个对话过程几乎听不出是机器在跟人交互。今年5月,阿里巴巴在国内展示这一技术时,现场就有观众惊呼太逼真了。


在今年双11期间,这款语音助手已为数百万用户提供服务。菜鸟提供的数据显示,平均每个快递员每天大约要送150-200个包裹,以一个电话半分钟至1分钟计算,每天光打电话就要3小时。这项技术的应用能够帮助快递员节省时间,更轻松地完成工作。

据悉,阿里巴巴目前正在限制这一技术的使用范围,以避免该技术被应用于机器对人类的欺诈行为。


附现场演示视频对话全录:

智能助手:“您好,您有一个上午送到文一西路588号的中通快递,请问方便签收吗?”

用户:“您哪位?”

智能助手:“我是菜鸟语音助手,在快递员派送前跟您确认”

用户:“我上午不在家呢”

智能助手:“那您方便留一个签收地址吗?我转告快递员为您安排。”

用户:“是什么东西啊?”

智能助手:“物流单上显示是文件”

用户:“嗯,那帮我放物业吧……算了,还是给我放到门口吧”

智能助手:“是送到门口是把?”

用户:……(沉默状态)

智能助手:“喂,还在吗?给您放在门口可以吗?”

用户:“可以的”

用户:“啊,对了,我好像还有一个中通的包裹,今天会派件吗?”

智能助手:“您稍等,这里看到您有一个中通快递的包裹,预计明天到达”

用户:“谢谢,再见”

智能助手:“再见”

END


∑编辑 | Gemini

来源 |观察者


微信公众号“算法数学之美”,由算法与数学之美团队打造的另一个公众号,欢迎大家扫码关注!



更多精彩:

10大反直觉的数学结论

为什么要学数学?因为这是一场战略性的投资

费马大定理,集惊险与武侠于一体

简单的解释,让你秒懂“最优化” 问题

一分钟看懂一维空间到十维空间

年度最牛老师催博士交论文 ! ! ! 博士身陷IS占领区,导师为督促其完成论文,派雇佣兵将其救出!

☞ 本科、硕士和博士到底有什么区别?

读博不易!约1/3博士生面临精神问题

小波变换通俗解释

微积分必背公式

影响计算机算法世界的十位大师

数据挖掘之七种常用的方法


算法数学之美微信公众号欢迎赐稿

稿件涉及数学、物理、算法、计算机、编程等相关领域,经采用我们将奉上稿酬。

投稿邮箱:math_alg@163.com

登录查看更多
8

相关内容

语音技术包含了很广泛的内涵,涉及语音合成、语音识别、说话人识别、语音增强、语音翻译等等。
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
【微众银行】联邦学习白皮书_v2.0,48页pdf,
专知会员服务
165+阅读 · 2020年4月26日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
106+阅读 · 2020年1月2日
【阿里技术干货】知识结构化在阿里小蜜中的应用
专知会员服务
97+阅读 · 2019年12月14日
多轮对话阅读理解新突破,追一科技登顶CoQA榜单
微软机器阅读理解在一场多轮对话挑战中媲美人类
微软丹棱街5号
19+阅读 · 2019年5月14日
AI会话能力超越人类!CoQA挑战赛微软创新纪录
微软小冰:全双工语音对话详解
AI100
7+阅读 · 2019年2月10日
小冰,请接电话!
微软丹棱街5号
5+阅读 · 2018年4月18日
Image Captioning: Transforming Objects into Words
Arxiv
7+阅读 · 2019年6月14日
Factor Graph Attention
Arxiv
6+阅读 · 2019年4月11日
Arxiv
4+阅读 · 2016年12月29日
VIP会员
相关资讯
多轮对话阅读理解新突破,追一科技登顶CoQA榜单
微软机器阅读理解在一场多轮对话挑战中媲美人类
微软丹棱街5号
19+阅读 · 2019年5月14日
AI会话能力超越人类!CoQA挑战赛微软创新纪录
微软小冰:全双工语音对话详解
AI100
7+阅读 · 2019年2月10日
小冰,请接电话!
微软丹棱街5号
5+阅读 · 2018年4月18日
Top
微信扫码咨询专知VIP会员