In this work, we propose a new model called triple-path attentive recurrent network (TPARN) for multichannel speech enhancement in the time domain. TPARN extends a single-channel dual-path network to a multichannel network by adding a third path along the spatial dimension. First, TPARN processes speech signals from all channels independently using a dual-path attentive recurrent network (ARN), which is a recurrent neural network (RNN) augmented with self-attention. Next, an ARN is introduced along the spatial dimension for spatial context aggregation. TPARN is designed as a multiple-input and multiple-output architecture to enhance all input channels simultaneously. Experimental results demonstrate the superiority of TPARN over existing state-of-the-art approaches.


翻译:在这项工作中,我们提出了一个新的模型,称为 " 三重心常态网络 ",用于在时间域内加强多通道语音。TRARN将单一通道双轨网络扩展至多通道网络,在空间层面增加第三条路径。首先,TRARN使用双重心常态网络(ARN)独立处理所有渠道的语音信号,这是一个经常神经网络,并辅之以自我关注。接着,在空间背景汇总的空间层面引入了ARN。TRARN设计为多输入和多输出结构,以同时增强所有输入渠道。实验结果显示TRARN优于现有最新方法。

0
下载
关闭预览

相关内容

【ICLR 2019】双曲注意力网络,Hyperbolic  Attention Network
专知会员服务
82+阅读 · 2020年6月21日
专知会员服务
60+阅读 · 2020年3月19日
【资源】语音增强资源集锦
专知
8+阅读 · 2020年7月4日
专访 | Recurrent AI:呼叫系统的「变废为宝」
机器之心
11+阅读 · 2018年11月28日
推荐|深度强化学习聊天机器人(附论文)!
全球人工智能
4+阅读 · 2018年1月30日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
【平行讲坛】平行图像:图像生成的一个新型理论框架
GAN生成式对抗网络
4+阅读 · 2017年9月15日
【推荐】RNN/LSTM时序预测
机器学习研究会
25+阅读 · 2017年9月8日
Memory-Gated Recurrent Networks
Arxiv
12+阅读 · 2020年12月24日
Arxiv
6+阅读 · 2019年4月8日
Neural Speech Synthesis with Transformer Network
Arxiv
5+阅读 · 2019年1月30日
Arxiv
3+阅读 · 2017年10月1日
Arxiv
5+阅读 · 2016年10月24日
VIP会员
相关VIP内容
【ICLR 2019】双曲注意力网络,Hyperbolic  Attention Network
专知会员服务
82+阅读 · 2020年6月21日
专知会员服务
60+阅读 · 2020年3月19日
Top
微信扫码咨询专知VIP会员