语音识别是人机交互的入口,是指机器/程序接收、解释声音,或理解和执行口头命令的能力。在智能时代,越来越多的场景在设计个性化的交互界面时,采用以对话为主的交互形式。一个完整的对话交互是由“听懂——理解——回答”三个步骤完成的闭环,其中,“听懂”需要语音识别(Automatic Speech Recognition, ASR)技术;“理解”需要自然语言处理(Natural Language Processing, NLP)技术;“回答”需要语音合成(Text To Speech, TTS)技术。三个步骤环环相扣,相辅相成。语音识别技术是对话交互的开端,是保证对话交互高效准确进行的基础。
今天分享来自于沙利文的《中国AI语音识别市场研究报告》,报告基于对语音识别的理解,从技术领域、行业领域、市场参与者等多个维度对中国AI语音识别市场进行分析,研究中国AI语音识别市场发展的驱动因素,主要趋势,以及进入壁垒和成功关键因素,并对中国AI语音识别主流厂商进行企业增长能力分析,为中国AI语音识别提供商及AI语音识别使用者提供参考。