7月3日,在2019百度AI开发者大会上,百度首席技术官王海峰在介绍百度大脑AI技术时谈到百度AI能力应用落地的重要产品之一“百度输入法”,截止目前,百度输入法日均语音请求量峰值已突破6.2亿次。
王海峰表示:“百度研发了流式多级的截断注意力模型(SMLTA),使语音识别的准确率大幅提升并保持了非常高的速度,这是首个基于流式注意力的语音识别线上服务,百度输入法语音识别的准确率因此相对提升15%以上”。
大会现场,百度语音技术部负责人高亮面对百度输入法念出的一段高难度中英文:“你的这个新model效果比baseline好多少,探索技术的depth和scope是我们的责任,我很喜欢barrier这个词,AI的value其实就是break barrier”。这样一段复杂的中英文混合“Rap”被百度输入法零误差地识别出来,语音输入得到了准确理解并根据语义进行正确断句。
今年1月百度输入法上线中英文自由说功能,通过语音识别算法SMLTA模型,百度输入法对中文音节和英文音素混合建模,并基于海量纯中文、纯英文和中英文三类数据进行模型训练,再将中文、英文和中英混合三个语言模型并行解码,融合标点和大小写进行处理。
据介绍,百度输入法还可以支持方言自由说,方言与方言、方言与普通话混合输入免切换。目前,百度输入法离线语音识别准确率已达到在线语音识别效果,同时占用更少的内存,此外离线和在线语音输入之间还可无缝切换。
— 【 THE END 】—
往期精彩文章回顾: