思必驰赵恒艺:升级DUI本质上是为打造中文版Alexa系统

2017 年 7 月 31 日 雷锋网 吕倩

随着物联网和智能化时代的到来,人类和计算机之间将产生一种全新的交互方式——自然语音交互。

不论智能音箱的兴盛是泡沫、虚火,还是行业爆发前的预热,作为核心技术支持存在的智能语音操作系统,已成为具备决定性作用的存在,日益受到各厂商的重视。

在欧美,Echo 能够成为现象级产品,很大程度得益于其背后的Alexa。国内智能语音系统企业也纷纷以Alexa系统为标尺。

成立于 2007 年的思必驰始终致力于语音技术与产品的结合,近期,多款由其提供核心技术支持的智能语音产品相继面世——包括天猫精灵X1、联想智能音箱、小米音箱、儿童机器人、智能后视镜等可对话产品等。

八月,思必驰或将正式上线研发许久的智能语音交互平台DUI。思必驰VP赵恒艺对雷锋网表示,简单直接地说,思必驰DUI的根本目的,就是打造中文版Alexa。

1、

过去,思必驰主要有两大产品线:一个是基于自然对话的语音识别和语义分析的 AIOS(AISpeech Operating System)人机对话操作系统,另一个是基于音频芯片和麦克风阵列的 AICHIP (AISpeech Chips)智能语音芯片模组。

2017年上半年,思必驰上百人团队封闭研发一款智能语音交互平台——DUI,据雷锋网了解,该平台将于八月底上线。

实际上,智能语音的本质是提取信号做处理,而对话交互不仅仅包含语音信息,也包括有来有往的信息交换。

就目前来讲,对话交互大致可分为问答式、命令式、任务式、闲聊式这四种类型,从思必驰角度来讲,则专注于垂直场景,以任务式对话为核心,兼具闲聊与问答功能,打造人性化交互。而DUI开放平台AISpeech Dialogue User Interface就是基于Dialogue,基于对话定制。

赵恒艺对雷锋网表示,目前DUI基本都是从思必驰上一代人工智能操作系统AIOS基础上承袭新的设计与架构,而新旧系统之间,更多是一种“净化”的关系。

除此之外,DUI将在AIOS基础之上,更加侧重超高度自由定制,如场景化的多轮对话,这是之前AIOS所没有的东西,属于完全由思必驰自我研发。

而对于操作系统的升级更迭原因,赵恒艺对雷锋网表示,一方面,技术总要经历迭代与进步,原系统AIOS当时确实在跨平台以及硬件系统操作等方面起到非常重要的作用,但同时也存在一些需要提高改进的地方;同时,整个AIOS系统也是为各合作厂商定制的,当他们针对性地提出改进意见,如“更高效的定义唤醒词,实现在线更新”等时,作为行业解决方案提供者,“思必驰当仁不让”,赵恒艺这样讲道。

目前,思必驰在业内已与众多合作伙伴携手打造诸多智能硬件产品,如智能音箱、智能蓝牙遥控器、智能冰箱、智能灯控、智能后视镜、儿童陪伴机器人、儿童故事机等,在过程中,很多厂商在产品自定义、内容升级、系统迭代等方面存在很大需求,这为AI语音市场带来极大的发展空间和机遇。

另外一方面,针对语义和对话的定制系统,厂商一旦需要对产品进行迭代更新,即需要双方联调,这种情况下实时性较差。这实际上就是过去时所延伸出来的一些新需求,进而促进一个新平台的诞生。

所以,“我们在设计DUI的过程中,延续了技术战,同时也把过去较大的用户痛点都给解决掉。”

2、

基于目前智能语音在实践中应用面临的问题,为个人/企业开发者们提供开放的可高度定制的对话平台成为刚需。

思必驰DUI开放平台包括阵列、声纹、唤醒、识别、合成、语义、对话、GUI等完整的人机对话交互核心技术,基于目前成熟的语音技术基础之上,提供开放定制能力,这是一个从前端语音信号处理到后端资源对接、技能开发等一站式的对话定制平台。

那么,用户到底需要什么?

赵恒艺以自己过去任乐视旗下乐乐语音CEO的身份举例称,相关产品的定制与智能语音交互技术的结合是没有那么快的,在具体需求与定制步调中间永远存在一个差距,上升空间总是很小,这是需要解决的问题。

而在DUI系统中,只需要将定制工作变成不需要集成代码就可以。因为之前需要集成、需要测试,同样一个语言模式,在产品内使用到不同地方,看上去都是一样的,但实际上是UI并不同。

不仅如此,可视化的数据开发平台,“云+端”的混合模式,能够让开发者实时掌控数据变动,依据产品用户需求,实时更新产品功能,用户可在第一时间感受最新技能,借此,思必驰通过C端及B端的应用变化,将进一步优化DUI开放平台,总体而言,这是一个多方共赢的趋势。

同时,赵恒艺表示,思必驰DUI开放平台将坚持开放的生态合作,支持多版本服务,连接技术、内容、硬件及服务,提供数据跟踪增值服务、用户画像在线运营、团队协作内部管理、实时测试产品效果、多版本管理增量热更新等服务。

这些功能和服务以模块化形式对外开放,充分考虑了开发者在使用DUI平台进行软件开发和后续扩展的需求,助力应用快速成型。DUI平台将以良好的向后兼容性进行升级与扩展,开发者无需顾虑DUI平台升级对原有程序的影响,从而减轻开发及运营压力。

除了预热对DUI的发布,思必驰表示将拨出2亿基金,用以扶持平台上优秀的开发者、优秀应用案例和创业项目,显示了思必驰通过DUI开放平台让语音赋能万物的决心。这将推动语音交互技术的应用领域,也将催生更多AI赋能产品的出现,加快人工智能技术的商业化落地,进一步走进千家万户。




读者福利


IBM 日前内部分享了AI /认知计算、云计算、区块链、物联网以及对话机器人领域的趋势报告,从这些报告或许能给在在这些领域苦苦探索的你一些灵感。关注雷锋网微信(leiphone-sz),输入 “0629” 获得报告原文。


  ● 



近期热门文章


巨头都在追逐的眼球追踪技术,究竟能带来什么?
我试驾了特斯拉 Model 3,这几个知识点你需要知道

兵贵神速,雷军趁出货量新高发起线下攻防战

凭阿里和腾讯实力,怎么今年才进世界500强?

国务院规划了新一代人工智能战略:2030年带动10万亿产业规模

烧光十亿清算离场,Jawbone 究竟是天作孽还是自作死?

联手诺基亚,雷军的千亿美金梦想又回来了

苹果中国的领导层,比预料中的更有故事



登录查看更多
0

相关内容

苏州思必驰信息科技有限公司[1] 是一家语音技术公司。2007年,思必驰创立在英国剑桥高新区。思必驰专注于将领先的系列智能语音技术应用于移动互联、智能设备、客户联络中心等行业。公司的中文名字是思必驰,思想必将驰骋,寓意着公司孤立自由的思想,以创新为本。同时这个名字还是英文单词Speech的音译,同样代表了公司立足智能语音技术行业的决心。
打怪升级!2020机器学习工程师技术路线图
专知会员服务
98+阅读 · 2020年6月3日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
301+阅读 · 2019年12月23日
【大规模数据系统,552页ppt】Large-scale Data Systems
专知会员服务
60+阅读 · 2019年12月21日
中文知识图谱构建技术以及应用的综述
专知会员服务
312+阅读 · 2019年10月19日
[综述]基于深度学习的开放领域对话系统研究综述
专知会员服务
78+阅读 · 2019年10月12日
IDC发布对话式人工智能白皮书|附下载
人工智能学家
6+阅读 · 2018年3月20日
基于 rasa 搭建中文对话系统 | 公开课
AI研习社
16+阅读 · 2018年1月12日
搜狗推出唇语识别技术 提升远场语音交互
智东西
3+阅读 · 2017年12月14日
一文读懂语音识别史
机械鸡
9+阅读 · 2017年10月16日
论文动态 | 基于知识图谱的问答系统关键技术研究 #01
开放知识图谱
16+阅读 · 2017年8月3日
Arxiv
4+阅读 · 2019年12月2日
Arxiv
8+阅读 · 2018年1月25日
Arxiv
3+阅读 · 2017年10月1日
VIP会员
Top
微信扫码咨询专知VIP会员