Acoustic echo cancellation (AEC) is a technique used in full-duplex communication systems to eliminate acoustic feedback of far-end speech. However, their performance degrades in naturalistic environments due to nonlinear distortions introduced by the speaker, as well as background noise, reverberation, and double-talk scenarios. To address nonlinear distortions and co-existing background noise, several deep neural network (DNN)-based joint AEC and denoising systems were developed. These systems are based on either purely "black-box" neural networks or "hybrid" systems that combine traditional AEC algorithms with neural networks. We propose an all-deep-learning framework that combines multi-channel AEC and our recently proposed self-attentive recurrent neural network (RNN) beamformer. We propose an all-deep-learning framework that combines multi-channel AEC and our recently proposed self-attentive recurrent neural network (RNN) beamformer. Furthermore, we propose a double-talk detection transformer (DTDT) module based on the multi-head attention transformer structure that computes attention over time by leveraging frame-wise double-talk predictions. Experiments show that our proposed method outperforms other approaches in terms of improving speech quality and speech recognition rate of an ASR system.


翻译:声频回声取消(AEC)是全复式通信系统用来消除远端语音反馈的一种技术,但是,由于演讲者引入非线性扭曲,以及背景噪音、回响和双谈话情景,其性能在自然环境中会退化。为了解决非线性扭曲和共同存在的背景噪音,我们开发了几个以深神经网络(DNN)为基础的联合AEC和脱网系统。这些系统的基础要么纯粹是“黑箱”神经网络,要么是将传统AEC算法与神经网络相结合的“合用”系统。我们提出了一个全深层次学习框架,将多频道AEC和我们最近提议的自惯性经常性神经网络(RNNN)结合起来。我们提出了一个全深层学习框架,将多频道AEC和我们最近提议的自惯性常态网络(DTDT)联合起来。我们提出了一个双向语音检测变换器(DTDT)模块,该模块基于多端语音和双向语音定位系统,通过双向语音定位系统,通过双向语音变换语音定位,显示其他语音定位分析方法的注意力结构,从而显示其他语音定位系统改进语音分析质量预测结构。

0
下载
关闭预览

相关内容

神经网络(Neural Networks)是世界上三个最古老的神经建模学会的档案期刊:国际神经网络学会(INNS)、欧洲神经网络学会(ENNS)和日本神经网络学会(JNNS)。神经网络提供了一个论坛,以发展和培育一个国际社会的学者和实践者感兴趣的所有方面的神经网络和相关方法的计算智能。神经网络欢迎高质量论文的提交,有助于全面的神经网络研究,从行为和大脑建模,学习算法,通过数学和计算分析,系统的工程和技术应用,大量使用神经网络的概念和技术。这一独特而广泛的范围促进了生物和技术研究之间的思想交流,并有助于促进对生物启发的计算智能感兴趣的跨学科社区的发展。因此,神经网络编委会代表的专家领域包括心理学,神经生物学,计算机科学,工程,数学,物理。该杂志发表文章、信件和评论以及给编辑的信件、社论、时事、软件调查和专利信息。文章发表在五个部分之一:认知科学,神经科学,学习系统,数学和计算分析、工程和应用。 官网地址:http://dblp.uni-trier.de/db/journals/nn/
近期必读的9篇 CVPR 2019【视觉目标跟踪】相关论文和代码
Stabilizing Transformers for Reinforcement Learning
专知会员服务
57+阅读 · 2019年10月17日
【资源】语音增强资源集锦
专知
8+阅读 · 2020年7月4日
LibRec 精选:基于LSTM的序列推荐实现(PyTorch)
LibRec智能推荐
50+阅读 · 2018年8月27日
Linguistically Regularized LSTMs for Sentiment Classification
黑龙江大学自然语言处理实验室
8+阅读 · 2018年5月4日
【推荐】RNN/LSTM时序预测
机器学习研究会
25+阅读 · 2017年9月8日
Arxiv
6+阅读 · 2019年7月11日
Neural Speech Synthesis with Transformer Network
Arxiv
5+阅读 · 2019年1月30日
Arxiv
19+阅读 · 2018年5月17日
VIP会员
相关VIP内容
近期必读的9篇 CVPR 2019【视觉目标跟踪】相关论文和代码
Stabilizing Transformers for Reinforcement Learning
专知会员服务
57+阅读 · 2019年10月17日
Top
微信扫码咨询专知VIP会员