阿里巴巴语音识别模型 DFSMN 使用指南
作者简介:
Enzo,目前就职于某一线互联网公司,从事大数据平台研发工作,曾参与《大数据技术基础》书籍、《大数据入门实战》书籍编写工作。
Chat 简介:
阿里巴巴 2018 年开源的语音识别模型 DFSMN,将全球语音识别准确率纪录提高至 96.04%。
DFSMN 模型,是阿里巴巴的高效工业级实现,相对于传统的 LSTM、BLSTM 等声学模型,该模型具备训练速度更快、识别更高效、识别准确率更高和模型大小压缩等效果。
本场 Chat 的主要内容包括:
语音识别流程简介;
Kaldi 的部署使用;
如何训练基于中文的 DFSMN 声学模型;
语音特征提取 MFCC 算法源码解读;
语音识别工具对比。
长按扫码报名