【资源】语音增强资源集锦 - 专知

会员服务 ·

0

【资源】语音增强资源集锦

2020 年 7 月 4 日 专知

【导读】本文整理了一些语音增强的论文、数据集、工具等资源。

Github链接：

https://github.com/nanahou/Awesome-Speech-Enhancement

论文6

Survey

A literature survey on single channel speech enhancement, 2020
Supervised speech separation based on deep learning: An Overview, 2017
A review on speech enhancement techniques, 2015
Nonlinear speech enhancement: an overview, 2007

Feature augmentation

Speech enhancement using self-adaptation and multi-head attention, ICASSP 2020
PAN: phoneme-aware network for monaural speech enhancement, ICASSP 2020
Noise tokens: learning neural noise templates for environment-aware speech enhancement
Speaker-aware deep denoising autoencoder with embedded speaker identity for speech enhancement, Interspeech 2019

Network design

Filter design

Efficient trainable front-ends for neural speech enhancement, ICASSP 2020

Fusion techniques

Masking and inpainting: a two-stage speech enhancement approach for low snr and non-stationary noise, ICASSP 2020
A composite dnn architecture for speech enhancement, ICASSP 2020
Multi-domain processing via hybrid denoising networks for speech enhancement, 2018

Attention

Speech enhancement using self-adaptation and multi-head attention, ICASSP 2020
Channel-attention dense u-net for multichannel speech enhancement, ICASSP 2020
T-GSA: transformer with gaussian-weighted self-attention for speech enhancement, ICASSP 2020

U-net

Phase-aware speech enhancement with deep complex u-net, ICLR 2019

GAN

PAGAN: a phase-adapted generative adversarial networks for speech enhancement, ICASSP 2020
Time-frequency masking-based speech enhancement using generative adversarial network, ICASSP 2018
SEGAN: speech enhancement generative adversarial network, Interspeech 2017

Phase reconstruction

Phase reconstruction based on recurrent phase unwrapping with deep neural networks, ICASSP 2020
PAGAN: a phase-adapted generative adversarial networks for speech enhancement, ICASSP 2020
Invertible dnn-based nonlinear time-frequency transform for speech enhancement, ICASSP 2020
Phase-aware speech enhancement with deep complex u-net, ICLR 2019

Learning strategy

Loss function

Speech denoising with deep feature losses, Interspeech 2019
End-to-end multi-task denoising for joint sdr and pesq optimization, Arxiv 2019

Other improvements

Improving robustness of deep learning based monaural speech enhancement against processing artifacts, ICASSP 2020 [paper]

工具

数据集

更多资源

Book or thesis

A Study on WaveNet, GANs and General CNNRNN Architectures, 2019
Deep learning: method and applications, 2016
Deep learning by Ian Goodfellow and Yoshua Bengio and Aaron Courville, 2016
Robust automatic speech recognition by Jinyu Li and Li Deng, 2015

Video

CCF speech seminar 2020
Real-time Single-channel Speech Enhancement with Recurrent Neural Networks by Microsoft Research, 2019
Deep learning in speech by Hongyi Li, 2019
High-Accuracy Neural-Network Models for Speech Enhancement, 2017
DNN-Based Online Speech Enhancement Using Multitask Learning and Suppression Rule Estimation, 2015
Microphone array signal processing: beyond the beamformer,2011

Slides

Deep learning in speech by Hongyi Li, 2019
Learning-based approach to speech enhancement and separation (INTERSPEECH tutorial, 2016)
Deep learning for speech/language processing (INTERSPEECH tutorial by Li Deng, 2015)
Speech enhancement algorithms (Stanford University, 2013)

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

8

相关内容

语音增强

语音增强是指当语音信号被各种各样的噪声干扰、甚至淹没后，从噪声背景中提取有用的语音信号，抑制、降低噪声干扰的技术。一句话，从含噪语音中提取尽可能纯净的原始语音。

迁移学习简明教程，11页ppt

迁移学习简明教程，11页ppt

专知会员服务

109+阅读 · 2020年8月4日

50+篇《神经架构搜索NAS》2020论文合集

专知会员服务

61+阅读 · 2020年3月19日

【课程】普林斯顿大学19年春季学期《机器学习优化》课程讲义

【课程】普林斯顿大学19年春季学期《机器学习优化》课程讲义

专知会员服务

85+阅读 · 2019年10月29日

【深度学习视频分析/多模态学习资源大列表】

【深度学习视频分析/多模态学习资源大列表】

专知会员服务

92+阅读 · 2019年10月16日

机器学习相关资源(框架、库、软件)大列表

机器学习相关资源(框架、库、软件)大列表

专知会员服务

40+阅读 · 2019年10月9日

【资源】2019年计算机视觉综述论文汇聚

【资源】2019年计算机视觉综述论文汇聚

专知

36+阅读 · 2019年11月26日

【资源】kaggle数据科学竞赛方案集锦

【资源】kaggle数据科学竞赛方案集锦

专知

27+阅读 · 2019年9月4日

图分类相关资源大列表

图分类相关资源大列表

专知

11+阅读 · 2019年7月18日

收藏 | Tensorflow实现的深度NLP模型集锦（附资源）

收藏 | Tensorflow实现的深度NLP模型集锦（附资源）

数据派THU

6+阅读 · 2019年5月3日

Github项目推荐 | 图神经网络(GNN)相关资源大列表

Github项目推荐 | 图神经网络(GNN)相关资源大列表

AI研习社

58+阅读 · 2019年4月1日

MelGAN: Generative Adversarial Networks for Conditional Waveform Synthesis

MelGAN: Generative Adversarial Networks for Conditional Waveform Synthesis

Arxiv

7+阅读 · 2019年10月8日

Generative Adversarial Networks: A Survey and Taxonomy

Generative Adversarial Networks: A Survey and Taxonomy

Arxiv

14+阅读 · 2019年6月4日

Phase-aware Speech Enhancement with Deep Complex U-Net

Phase-aware Speech Enhancement with Deep Complex U-Net

Arxiv

15+阅读 · 2019年3月7日

Differentiable Dynamic Programming for Structured Prediction and Attention

Arxiv

56+阅读 · 2018年2月20日

Attention Is All You Need

Arxiv

27+阅读 · 2017年12月6日

VIP会员

相关主题

注意力机制

相关VIP内容

迁移学习简明教程，11页ppt

迁移学习简明教程，11页ppt

专知会员服务

109+阅读 · 2020年8月4日

50+篇《神经架构搜索NAS》2020论文合集

专知会员服务

61+阅读 · 2020年3月19日

【课程】普林斯顿大学19年春季学期《机器学习优化》课程讲义

【课程】普林斯顿大学19年春季学期《机器学习优化》课程讲义

专知会员服务

85+阅读 · 2019年10月29日

【深度学习视频分析/多模态学习资源大列表】

【深度学习视频分析/多模态学习资源大列表】

专知会员服务

92+阅读 · 2019年10月16日

机器学习相关资源(框架、库、软件)大列表

机器学习相关资源(框架、库、软件)大列表

专知会员服务

40+阅读 · 2019年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

从代码基础模型到智能体与应用：代码智能的全面综述与实践指南

《北约认知战概念报告》

【MIT博士论文】高效的视觉合成生成模型

美海军放弃星座级转而采用国家安全巡逻舰设计

相关资讯

【资源】2019年计算机视觉综述论文汇聚

【资源】2019年计算机视觉综述论文汇聚

专知

36+阅读 · 2019年11月26日

【资源】kaggle数据科学竞赛方案集锦

【资源】kaggle数据科学竞赛方案集锦

专知

27+阅读 · 2019年9月4日

图分类相关资源大列表

图分类相关资源大列表

专知

11+阅读 · 2019年7月18日

收藏 | Tensorflow实现的深度NLP模型集锦（附资源）

收藏 | Tensorflow实现的深度NLP模型集锦（附资源）

数据派THU

6+阅读 · 2019年5月3日

Github项目推荐 | 图神经网络(GNN)相关资源大列表

Github项目推荐 | 图神经网络(GNN)相关资源大列表

AI研习社

58+阅读 · 2019年4月1日

相关论文

MelGAN: Generative Adversarial Networks for Conditional Waveform Synthesis

MelGAN: Generative Adversarial Networks for Conditional Waveform Synthesis

Arxiv

7+阅读 · 2019年10月8日

Generative Adversarial Networks: A Survey and Taxonomy

Generative Adversarial Networks: A Survey and Taxonomy

Arxiv

14+阅读 · 2019年6月4日

Phase-aware Speech Enhancement with Deep Complex U-Net

Phase-aware Speech Enhancement with Deep Complex U-Net

Arxiv

15+阅读 · 2019年3月7日

Differentiable Dynamic Programming for Structured Prediction and Attention

Arxiv

56+阅读 · 2018年2月20日

Attention Is All You Need

Arxiv

27+阅读 · 2017年12月6日

大家都在搜

大型语言模型

蓝牙安全攻防

奈飞的颠覆式创新

模型压缩 | 知识蒸馏经典解读

微信扫码咨询专知VIP会员