Speech enhancement has benefited from the success of deep learning in terms of intelligibility and perceptual quality. Conventional time-frequency (TF) domain methods focus on predicting TF-masks or speech spectrum,via a naive convolution neural network or recurrent neural network.Some recent studies were based on Complex spectral Mapping convolution recurrent neural network (CRN) . These models skiped directly from encoder layers' output and decoder layers' input ,which maybe thoughtless. We proposed an attention mechanism based skip connection between encoder and decoder layers,namely Complex Spectral Mapping With Attention Based Convolution Recurrent Neural Network (CARN).Compared with CRN model,the proposed CARN model improved more than 10% relatively at several metrics such as PESQ,CBAK,COVL,CSIG and son,and outperformed the place 1st model in both real time and non-real time track of the DNS Challenge 2020 at these metrics.


翻译:在智能和感知质量方面,深层学习的成功使语音的增强受益。常规时间频域方法侧重于预测TF-maks或言语频谱,通过天真的 convolution 神经网络或经常性神经网络。最近的一些研究基于复杂的光谱映射共发神经网络(CRN) 。这些模型直接跳过编码器层的输出和分解层输入,这或许是没有思维的。我们建议了一种关注机制,它基于编码器层和分解器层之间的跳过连接,即以注意为基点的复杂光谱映射元网络(CARN)。与CRN模型相比,拟议的CARN模型在PESQ、CBAK、COVL、CSIG和儿子等若干指标上相对改进了10%以上,并在这些指标的DNS挑战2020实时和非实时轨道上超越了第一个模型。

0
下载
关闭预览

相关内容

语音增强是指当语音信号被各种各样的噪声干扰、甚至淹没后,从噪声背景中提取有用的语音信号,抑制、降低噪声干扰的技术。一句话,从含噪语音中提取尽可能纯净的原始语音。
达摩院基于元学习的对话系统
专知会员服务
25+阅读 · 2021年1月1日
图像分割方法综述
专知会员服务
56+阅读 · 2020年11月22日
近期必读的六篇 ICLR 2021【推荐系统】相关投稿论文
专知会员服务
47+阅读 · 2020年10月13日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
60+阅读 · 2019年10月17日
【资源】语音增强资源集锦
专知
8+阅读 · 2020年7月4日
LibRec 精选:AutoML for Contextual Bandits
LibRec智能推荐
7+阅读 · 2019年9月19日
《pyramid Attention Network for Semantic Segmentation》
统计学习与视觉计算组
44+阅读 · 2018年8月30日
语音顶级会议Interspeech2018接受论文列表!
专知
6+阅读 · 2018年6月10日
推荐|深度强化学习聊天机器人(附论文)!
全球人工智能
4+阅读 · 2018年1月30日
Simple Recurrent Unit For Sentence Classification
哈工大SCIR
6+阅读 · 2017年11月29日
【推荐】TensorFlow手把手CNN实践指南
机器学习研究会
5+阅读 · 2017年8月17日
【深度学习基础】4. Recurrent Neural Networks
微信AI
16+阅读 · 2017年7月19日
Phase-aware Speech Enhancement with Deep Complex U-Net
Neural Speech Synthesis with Transformer Network
Arxiv
5+阅读 · 2019年1月30日
Arxiv
8+阅读 · 2018年11月27日
VIP会员
Top
微信扫码咨询专知VIP会员