【资源】语音增强资源集锦

2020 年 7 月 4 日 专知

【导读】本文整理了一些语音增强的论文、数据集、工具等资源。


Github链接:

https://github.com/nanahou/Awesome-Speech-Enhancement


论文6

Survey

  • A literature survey on single channel speech enhancement, 2020 

  • Supervised speech separation based on deep learning: An Overview, 2017

  • A review on speech enhancement techniques, 2015 

  • Nonlinear speech enhancement: an overview, 2007 

Feature augmentation

  • Speech enhancement using self-adaptation and multi-head attention, ICASSP 2020

  • PAN: phoneme-aware network for monaural speech enhancement, ICASSP 2020

  • Noise tokens: learning neural noise templates for environment-aware speech enhancement

  • Speaker-aware deep denoising autoencoder with embedded speaker identity for speech enhancement, Interspeech 2019

Network design

Filter design
  • Efficient trainable front-ends for neural speech enhancement, ICASSP 2020 

Fusion techniques
  • Masking and inpainting: a two-stage speech enhancement approach for low snr and non-stationary noise, ICASSP 2020 

  • A composite dnn architecture for speech enhancement, ICASSP 2020 

  • Multi-domain processing via hybrid denoising networks for speech enhancement, 2018 

Attention
  • Speech enhancement using self-adaptation and multi-head attention, ICASSP 2020 

  • Channel-attention dense u-net for multichannel speech enhancement, ICASSP 2020

  • T-GSA: transformer with gaussian-weighted self-attention for speech enhancement, ICASSP 2020

U-net
  • Phase-aware speech enhancement with deep complex u-net, ICLR 2019 

GAN
  • PAGAN: a phase-adapted generative adversarial networks for speech enhancement, ICASSP 2020 

  • Time-frequency masking-based speech enhancement using generative adversarial network, ICASSP 2018 

  • SEGAN: speech enhancement generative adversarial network, Interspeech 2017

Phase reconstruction

  • Phase reconstruction based on recurrent phase unwrapping with deep neural networks, ICASSP 2020

  • PAGAN: a phase-adapted generative adversarial networks for speech enhancement, ICASSP 2020 

  • Invertible dnn-based nonlinear time-frequency transform for speech enhancement, ICASSP 2020 

  • Phase-aware speech enhancement with deep complex u-net, ICLR 2019 

Learning strategy

Loss function
  • Speech denoising with deep feature losses, Interspeech 2019

  • End-to-end multi-task denoising for joint sdr and pesq optimization, Arxiv 2019 

Other improvements

  • Improving robustness of deep learning based monaural speech enhancement against processing artifacts, ICASSP 2020 [paper]

工具

数据集

更多资源

Book or thesis

  • A Study on WaveNet, GANs and General CNNRNN Architectures, 2019 

  • Deep learning: method and applications, 2016 

  • Deep learning by Ian Goodfellow and Yoshua Bengio and Aaron Courville, 2016 

  • Robust automatic speech recognition by Jinyu Li and Li Deng, 2015 

Video

  • CCF speech seminar 2020

  • Real-time Single-channel Speech Enhancement with Recurrent Neural Networks by Microsoft Research, 2019

  • Deep learning in speech by Hongyi Li, 2019 

  • High-Accuracy Neural-Network Models for Speech Enhancement, 2017

  • DNN-Based Online Speech Enhancement Using Multitask Learning and Suppression Rule Estimation, 2015 

  • Microphone array signal processing: beyond the beamformer,2011

Slides

  • Deep learning in speech by Hongyi Li, 2019

  • Learning-based approach to speech enhancement and separation (INTERSPEECH tutorial, 2016)

  • Deep learning for speech/language processing (INTERSPEECH tutorial by Li Deng, 2015)

  • Speech enhancement algorithms (Stanford University, 2013)

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
8

相关内容

语音增强是指当语音信号被各种各样的噪声干扰、甚至淹没后,从噪声背景中提取有用的语音信号,抑制、降低噪声干扰的技术。一句话,从含噪语音中提取尽可能纯净的原始语音。
迁移学习简明教程,11页ppt
专知会员服务
107+阅读 · 2020年8月4日
【清华大学】图随机神经网络,Graph Random Neural Networks
专知会员服务
154+阅读 · 2020年5月26日
专知会员服务
60+阅读 · 2020年3月19日
专知会员服务
109+阅读 · 2020年3月12日
【深度学习视频分析/多模态学习资源大列表】
专知会员服务
91+阅读 · 2019年10月16日
密歇根大学《20年目标检测综述》
专知会员服务
97+阅读 · 2019年10月13日
机器学习相关资源(框架、库、软件)大列表
专知会员服务
39+阅读 · 2019年10月9日
图像/视频去噪算法资源集锦
专知
18+阅读 · 2019年12月14日
【资源】2019年计算机视觉综述论文汇聚
专知
36+阅读 · 2019年11月26日
【资源】机器学习资源大列表
专知
58+阅读 · 2019年10月16日
【资源】领域自适应相关论文、代码分享
专知
31+阅读 · 2019年10月12日
【资源】kaggle数据科学竞赛方案集锦
专知
27+阅读 · 2019年9月4日
自动化机器学习(AutoML)文献/工具/项目资源大列表分享
深度学习与NLP
6+阅读 · 2019年9月2日
图分类相关资源大列表
专知
11+阅读 · 2019年7月18日
Graph Neural Network(GNN)最全资源整理分享
深度学习与NLP
339+阅读 · 2019年7月9日
Github项目推荐 | 图神经网络(GNN)相关资源大列表
Generative Adversarial Networks: A Survey and Taxonomy
Phase-aware Speech Enhancement with Deep Complex U-Net
Arxiv
8+阅读 · 2018年11月27日
Arxiv
27+阅读 · 2017年12月6日
VIP会员
相关VIP内容
迁移学习简明教程,11页ppt
专知会员服务
107+阅读 · 2020年8月4日
【清华大学】图随机神经网络,Graph Random Neural Networks
专知会员服务
154+阅读 · 2020年5月26日
专知会员服务
60+阅读 · 2020年3月19日
专知会员服务
109+阅读 · 2020年3月12日
【深度学习视频分析/多模态学习资源大列表】
专知会员服务
91+阅读 · 2019年10月16日
密歇根大学《20年目标检测综述》
专知会员服务
97+阅读 · 2019年10月13日
机器学习相关资源(框架、库、软件)大列表
专知会员服务
39+阅读 · 2019年10月9日
相关资讯
图像/视频去噪算法资源集锦
专知
18+阅读 · 2019年12月14日
【资源】2019年计算机视觉综述论文汇聚
专知
36+阅读 · 2019年11月26日
【资源】机器学习资源大列表
专知
58+阅读 · 2019年10月16日
【资源】领域自适应相关论文、代码分享
专知
31+阅读 · 2019年10月12日
【资源】kaggle数据科学竞赛方案集锦
专知
27+阅读 · 2019年9月4日
自动化机器学习(AutoML)文献/工具/项目资源大列表分享
深度学习与NLP
6+阅读 · 2019年9月2日
图分类相关资源大列表
专知
11+阅读 · 2019年7月18日
Graph Neural Network(GNN)最全资源整理分享
深度学习与NLP
339+阅读 · 2019年7月9日
Github项目推荐 | 图神经网络(GNN)相关资源大列表
Top
微信扫码咨询专知VIP会员