增强编码器: 使用矢量量化自动编码器的噪声强调语音编码 (Enhancing into the codec: Noise Robust Speech Coding with Vector-Quantized Autoencoders)

Audio codecs based on discretized neural autoencoders have recently been developed and shown to provide significantly higher compression levels for comparable quality speech output. However, these models are tightly coupled with speech content, and produce unintended outputs in noisy conditions. Based on VQ-VAE autoencoders with WaveRNN decoders, we develop compressor-enhancer encoders and accompanying decoders, and show that they operate well in noisy conditions. We also observe that a compressor-enhancer model performs better on clean speech inputs than a compressor model trained only on clean speech.

翻译：最近开发了基于离散神经自动自动读取器的音频编码器,显示它们为类似的高质量语音输出提供了高得多的压缩水平。但是,这些模型与语音内容紧密结合,在噪音条件下产生意外输出。根据VQ-VAE自动编码器和WaveRNNN 解调器,我们开发了压缩机-增生器编码器和配套解调器,并显示它们在吵闹的条件下运作良好。我们还观察到,压缩机强化器模型在清洁语音输入方面比仅受过清洁语音培训的压缩机模型表现得更好。

相关内容

自编码器

关注 140

自动编码器是一种人工神经网络，用于以无监督的方式学习有效的数据编码。自动编码器的目的是通过训练网络忽略信号“噪声”来学习一组数据的表示（编码），通常用于降维。与简化方面一起，学习了重构方面，在此，自动编码器尝试从简化编码中生成尽可能接近其原始输入的表示形式，从而得到其名称。基本模型存在几种变体，其目的是迫使学习的输入表示形式具有有用的属性。自动编码器可有效地解决许多应用问题，从面部识别到获取单词的语义。

【Google】梯度下降，48页ppt

专知会员服务

81+阅读 · 2020年12月5日

【Google】深度学习对抗鲁棒性，43页ppt

专知会员服务

45+阅读 · 2020年10月31日

商业数据分析，39页ppt

专知会员服务

165+阅读 · 2020年6月2日

【阿尔托大学】图神经网络，Graph Neural Networks，附60页ppt

专知会员服务

185+阅读 · 2020年4月26日