作者 | 中科院自动化所
编辑 | 贾伟
为解决经典的注意力语音识别模型不支持在线识别、边界定位等问题,中科院自动化所董林昊博士、徐波研究员将脉冲神经网络中的整合发放思想进行连续化,提出一种低复杂度并具有单调一致性的序列转换机制——连续整合发放(Continuous Integrate-and-Fire,CIF)。基于CIF的模型不仅有效地支持了在线识别、边界定位及声学 Embedding 提取,而且在两个中文基准语音识别集(HKUST、AISHELL-2)上创造了SOTA的性能。相关成果被ICASSP 2020录用为Oral论文。