随着物联网和智能化时代的到来,人类和计算机之间将产生一种全新的交互方式——自然语音交互。
不论智能音箱的兴盛是泡沫、虚火,还是行业爆发前的预热,作为核心技术支持存在的智能语音操作系统,已成为具备决定性作用的存在,日益受到各厂商的重视。
在欧美,Echo 能够成为现象级产品,很大程度得益于其背后的Alexa。国内智能语音系统企业也纷纷以Alexa系统为标尺。
八月,思必驰或将正式上线研发许久的智能语音交互平台DUI。思必驰VP赵恒艺对雷锋网表示,简单直接地说,思必驰DUI的根本目的,就是打造中文版Alexa。
1、
过去,思必驰主要有两大产品线:一个是基于自然对话的语音识别和语义分析的 AIOS(AISpeech Operating System)人机对话操作系统,另一个是基于音频芯片和麦克风阵列的 AICHIP (AISpeech Chips)智能语音芯片模组。
2017年上半年,思必驰上百人团队封闭研发一款智能语音交互平台——DUI,据雷锋网了解,该平台将于八月底上线。
实际上,智能语音的本质是提取信号做处理,而对话交互不仅仅包含语音信息,也包括有来有往的信息交换。
就目前来讲,对话交互大致可分为问答式、命令式、任务式、闲聊式这四种类型,从思必驰角度来讲,则专注于垂直场景,以任务式对话为核心,兼具闲聊与问答功能,打造人性化交互。而DUI开放平台AISpeech Dialogue User Interface就是基于Dialogue,基于对话定制。
赵恒艺对雷锋网表示,目前DUI基本都是从思必驰上一代人工智能操作系统AIOS基础上承袭新的设计与架构,而新旧系统之间,更多是一种“净化”的关系。
除此之外,DUI将在AIOS基础之上,更加侧重超高度自由定制,如场景化的多轮对话,这是之前AIOS所没有的东西,属于完全由思必驰自我研发。
而对于操作系统的升级更迭原因,赵恒艺对雷锋网表示,一方面,技术总要经历迭代与进步,原系统AIOS当时确实在跨平台以及硬件系统操作等方面起到非常重要的作用,但同时也存在一些需要提高改进的地方;同时,整个AIOS系统也是为各合作厂商定制的,当他们针对性地提出改进意见,如“更高效的定义唤醒词,实现在线更新”等时,作为行业解决方案提供者,“思必驰当仁不让”,赵恒艺这样讲道。
目前,思必驰在业内已与众多合作伙伴携手打造诸多智能硬件产品,如智能音箱、智能蓝牙遥控器、智能冰箱、智能灯控、智能后视镜、儿童陪伴机器人、儿童故事机等,在过程中,很多厂商在产品自定义、内容升级、系统迭代等方面存在很大需求,这为AI语音市场带来极大的发展空间和机遇。
另外一方面,针对语义和对话的定制系统,厂商一旦需要对产品进行迭代更新,即需要双方联调,这种情况下实时性较差。这实际上就是过去时所延伸出来的一些新需求,进而促进一个新平台的诞生。
所以,“我们在设计DUI的过程中,延续了技术战,同时也把过去较大的用户痛点都给解决掉。”
2、
基于目前智能语音在实践中应用面临的问题,为个人/企业开发者们提供开放的可高度定制的对话平台成为刚需。
那么,用户到底需要什么?
赵恒艺以自己过去任乐视旗下乐乐语音CEO的身份举例称,相关产品的定制与智能语音交互技术的结合是没有那么快的,在具体需求与定制步调中间永远存在一个差距,上升空间总是很小,这是需要解决的问题。
而在DUI系统中,只需要将定制工作变成不需要集成代码就可以。因为之前需要集成、需要测试,同样一个语言模式,在产品内使用到不同地方,看上去都是一样的,但实际上是UI并不同。
不仅如此,可视化的数据开发平台,“云+端”的混合模式,能够让开发者实时掌控数据变动,依据产品用户需求,实时更新产品功能,用户可在第一时间感受最新技能,借此,思必驰通过C端及B端的应用变化,将进一步优化DUI开放平台,总体而言,这是一个多方共赢的趋势。
同时,赵恒艺表示,思必驰DUI开放平台将坚持开放的生态合作,支持多版本服务,连接技术、内容、硬件及服务,提供数据跟踪增值服务、用户画像在线运营、团队协作内部管理、实时测试产品效果、多版本管理增量热更新等服务。
这些功能和服务以模块化形式对外开放,充分考虑了开发者在使用DUI平台进行软件开发和后续扩展的需求,助力应用快速成型。DUI平台将以良好的向后兼容性进行升级与扩展,开发者无需顾虑DUI平台升级对原有程序的影响,从而减轻开发及运营压力。
除了预热对DUI的发布,思必驰表示将拨出2亿基金,用以扶持平台上优秀的开发者、优秀应用案例和创业项目,显示了思必驰通过DUI开放平台让语音赋能万物的决心。这将推动语音交互技术的应用领域,也将催生更多AI赋能产品的出现,加快人工智能技术的商业化落地,进一步走进千家万户。
读者福利 IBM 日前内部分享了AI /认知计算、云计算、区块链、物联网以及对话机器人领域的趋势报告,从这些报告或许能给在在这些领域苦苦探索的你一些灵感。关注雷锋网微信(leiphone-sz),输入 “0629” 获得报告原文。 ● ● ● 巨头都在追逐的眼球追踪技术,究竟能带来什么? 国务院规划了新一代人工智能战略:2030年带动10万亿产业规模 |