EURO: ESPnet Unsupervised ASR Open-source Toolkit - 专知论文

会员服务 ·

0

无监督 · 语音识别 · state-of-the-art · Extensibility · MoDELS ·

2023 年 5 月 21 日

EURO: ESPnet Unsupervised ASR Open-source Toolkit

翻译：暂无翻译

Dongji Gao,Jiatong Shi,Shun-Po Chuang,Leibny Paola Garcia,Hung-yi Lee,Shinji Watanabe,Sanjeev Khudanpur

This paper describes the ESPnet Unsupervised ASR Open-source Toolkit (EURO), an end-to-end open-source toolkit for unsupervised automatic speech recognition (UASR). EURO adopts the state-of-the-art UASR learning method introduced by the Wav2vec-U, originally implemented at FAIRSEQ, which leverages self-supervised speech representations and adversarial training. In addition to wav2vec2, EURO extends the functionality and promotes reproducibility for UASR tasks by integrating S3PRL and k2, resulting in flexible frontends from 27 self-supervised models and various graph-based decoding strategies. EURO is implemented in ESPnet and follows its unified pipeline to provide UASR recipes with a complete setup. This improves the pipeline's efficiency and allows EURO to be easily applied to existing datasets in ESPnet. Extensive experiments on three mainstream self-supervised models demonstrate the toolkit's effectiveness and achieve state-of-the-art UASR performance on TIMIT and LibriSpeech datasets. EURO will be publicly available at https://github.com/espnet/espnet, aiming to promote this exciting and emerging research area based on UASR through open-source activity.

翻译：暂无翻译

0

相关内容

无监督

百篇论文纵览大型语言模型最新研究进展

百篇论文纵览大型语言模型最新研究进展

专知会员服务

70+阅读 · 2023年3月31日

2020数据工程师成长路线图

专知会员服务

41+阅读 · 2020年9月6日

Linux导论，Introduction to Linux，96页ppt

Linux导论，Introduction to Linux，96页ppt

专知会员服务

82+阅读 · 2020年7月26日

50+篇《神经架构搜索NAS》2020论文合集

专知会员服务

61+阅读 · 2020年3月19日

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

专知会员服务

167+阅读 · 2020年3月18日

CVPR 2020 论文开源项目合集

专知会员服务

110+阅读 · 2020年3月12日

Aspect-Oriented Syntax Network for Aspect-Based Sentiment Analysis，中山大学数据科学与计算机学院权小军教授，第八届全国社会媒体处理大会SMP2019

Aspect-Oriented Syntax Network for Aspect-Based Sentiment Analysis，中山大学数据科学与计算机学院权小军教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

19+阅读 · 2019年10月22日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

182+阅读 · 2019年10月11日

[综述]深度学习下的场景文本检测与识别

[综述]深度学习下的场景文本检测与识别

专知会员服务

78+阅读 · 2019年10月10日

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

专知会员服务

41+阅读 · 2019年10月9日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

无监督元学习表示学习

无监督元学习表示学习

CreateAMind

27+阅读 · 2019年1月4日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

disentangled-representation-papers

disentangled-representation-papers

CreateAMind

26+阅读 · 2018年9月12日

vae 相关论文表示学习 1

vae 相关论文表示学习 1

CreateAMind

12+阅读 · 2018年9月6日

推荐｜清华老师推荐30来项算法代码和工具包列表（开源）

推荐｜清华老师推荐30来项算法代码和工具包列表（开源）

全球人工智能

26+阅读 · 2018年3月26日

【论文推荐】最新六篇视频分类相关论文—层次标签推断、知识图谱、CNNs、DAiSEE、表观和关系网络、转移学习

【论文推荐】最新六篇视频分类相关论文—层次标签推断、知识图谱、CNNs、DAiSEE、表观和关系网络、转移学习

专知

14+阅读 · 2018年2月18日

【推荐】用TensorFlow实现LSTM社交对话股市情感分析

【推荐】用TensorFlow实现LSTM社交对话股市情感分析

机器学习研究会

11+阅读 · 2018年1月14日

MoCoGAN 分解运动和内容的视频生成

MoCoGAN 分解运动和内容的视频生成

CreateAMind

18+阅读 · 2017年10月21日

电纺双相前驱体制备纳米莫来石纤维及其微结构和机械性能研究

国家自然科学基金

0+阅读 · 2015年12月31日

多层梯度多元掺杂ta-C纳米复合涂层制备与切削性能研究

国家自然科学基金

0+阅读 · 2013年12月31日

氮化镓发光管（GaN LED）参数退化模型的研究

国家自然科学基金

0+阅读 · 2012年12月31日

低介电常数BNw/Si3N4复合透波材料研究

国家自然科学基金

0+阅读 · 2012年12月31日

表面原位生长晶须对陶瓷的润湿性及其与金属钎焊的影响机理研究

国家自然科学基金

0+阅读 · 2012年12月31日

白光LED用卤化钙和氧化钙基双掺杂发光材料的能量传递与光谱调控研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于粘滑驱动的跨尺度纳米定位运动生成机理及实现方法

国家自然科学基金

0+阅读 · 2011年12月31日

体全息光栅的制作及其改善半导体激光器光谱特性的研究

国家自然科学基金

0+阅读 · 2009年12月31日

铝/钛、铝/钢及铝/铜异种合金激光深熔钎焊机理及工艺

国家自然科学基金

0+阅读 · 2008年12月31日

金属铝-氮化铝-氧化锆复相材料的制备与性能研究

国家自然科学基金

0+阅读 · 2008年12月31日

ESPnet-ST-v2: Multipurpose Spoken Language Translation Toolkit

Arxiv

0+阅读 · 2023年7月6日

Chinese Fine-Grained Financial Sentiment Analysis with Large Language Models

Arxiv

0+阅读 · 2023年7月6日

SAITS: Self-Attention-based Imputation for Time Series

Arxiv

0+阅读 · 2023年7月5日

ALBERTI, a Multilingual Domain Specific Language Model for Poetry Analysis

Arxiv

0+阅读 · 2023年7月3日

Exploring Spoken Named Entity Recognition: A Cross-Lingual Perspective

Arxiv

0+阅读 · 2023年7月3日

A Survey on Multimodal Large Language Models

Arxiv

25+阅读 · 2023年6月23日

Conditional Prompt Learning for Vision-Language Models

Conditional Prompt Learning for Vision-Language Models

Arxiv

13+阅读 · 2022年3月10日

Paradigm Shift in Natural Language Processing

Arxiv

28+阅读 · 2021年9月26日

Disentangled Information Bottleneck

Disentangled Information Bottleneck

Arxiv

12+阅读 · 2020年12月22日

Attention U-Net: Learning Where to Look for the Pancreas

Arxiv

17+阅读 · 2018年5月20日

VIP会员

文章信息

相关主题

state-of-the-art

相关VIP内容

百篇论文纵览大型语言模型最新研究进展

百篇论文纵览大型语言模型最新研究进展

专知会员服务

70+阅读 · 2023年3月31日

2020数据工程师成长路线图

专知会员服务

41+阅读 · 2020年9月6日

Linux导论，Introduction to Linux，96页ppt

Linux导论，Introduction to Linux，96页ppt

专知会员服务

82+阅读 · 2020年7月26日

50+篇《神经架构搜索NAS》2020论文合集

专知会员服务

61+阅读 · 2020年3月19日

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

专知会员服务

167+阅读 · 2020年3月18日

CVPR 2020 论文开源项目合集

专知会员服务

110+阅读 · 2020年3月12日

Aspect-Oriented Syntax Network for Aspect-Based Sentiment Analysis，中山大学数据科学与计算机学院权小军教授，第八届全国社会媒体处理大会SMP2019

Aspect-Oriented Syntax Network for Aspect-Based Sentiment Analysis，中山大学数据科学与计算机学院权小军教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

19+阅读 · 2019年10月22日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

182+阅读 · 2019年10月11日

[综述]深度学习下的场景文本检测与识别

[综述]深度学习下的场景文本检测与识别

专知会员服务

78+阅读 · 2019年10月10日

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

专知会员服务

41+阅读 · 2019年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

《城市滨海地区：理解复杂多变环境下的指挥控制框架》50页报告

《理解城市战及其在俄乌战争中的表现》报告

美空军“顶点2025”实验：推进AI在C2、动态目标锁定与联盟集成中的应用

《建设式兵棋模拟作为战术集群配置优化的关键组成部分》

相关资讯

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

无监督元学习表示学习

无监督元学习表示学习

CreateAMind

27+阅读 · 2019年1月4日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

disentangled-representation-papers

disentangled-representation-papers

CreateAMind

26+阅读 · 2018年9月12日

vae 相关论文表示学习 1

vae 相关论文表示学习 1

CreateAMind

12+阅读 · 2018年9月6日

推荐｜清华老师推荐30来项算法代码和工具包列表（开源）

推荐｜清华老师推荐30来项算法代码和工具包列表（开源）

全球人工智能

26+阅读 · 2018年3月26日

【论文推荐】最新六篇视频分类相关论文—层次标签推断、知识图谱、CNNs、DAiSEE、表观和关系网络、转移学习

【论文推荐】最新六篇视频分类相关论文—层次标签推断、知识图谱、CNNs、DAiSEE、表观和关系网络、转移学习

专知

14+阅读 · 2018年2月18日

【推荐】用TensorFlow实现LSTM社交对话股市情感分析

【推荐】用TensorFlow实现LSTM社交对话股市情感分析

机器学习研究会

11+阅读 · 2018年1月14日

MoCoGAN 分解运动和内容的视频生成

MoCoGAN 分解运动和内容的视频生成

CreateAMind

18+阅读 · 2017年10月21日

相关论文

ESPnet-ST-v2: Multipurpose Spoken Language Translation Toolkit

Arxiv

0+阅读 · 2023年7月6日

Chinese Fine-Grained Financial Sentiment Analysis with Large Language Models

Arxiv

0+阅读 · 2023年7月6日

SAITS: Self-Attention-based Imputation for Time Series

Arxiv

0+阅读 · 2023年7月5日

ALBERTI, a Multilingual Domain Specific Language Model for Poetry Analysis

Arxiv

0+阅读 · 2023年7月3日

Exploring Spoken Named Entity Recognition: A Cross-Lingual Perspective

Arxiv

0+阅读 · 2023年7月3日

A Survey on Multimodal Large Language Models

Arxiv

25+阅读 · 2023年6月23日

Conditional Prompt Learning for Vision-Language Models

Conditional Prompt Learning for Vision-Language Models

Arxiv

13+阅读 · 2022年3月10日

Paradigm Shift in Natural Language Processing

Arxiv

28+阅读 · 2021年9月26日

Disentangled Information Bottleneck

Disentangled Information Bottleneck

Arxiv

12+阅读 · 2020年12月22日

Attention U-Net: Learning Where to Look for the Pancreas

Arxiv

17+阅读 · 2018年5月20日

相关基金

电纺双相前驱体制备纳米莫来石纤维及其微结构和机械性能研究

国家自然科学基金

0+阅读 · 2015年12月31日

多层梯度多元掺杂ta-C纳米复合涂层制备与切削性能研究

国家自然科学基金

0+阅读 · 2013年12月31日

氮化镓发光管（GaN LED）参数退化模型的研究

国家自然科学基金

0+阅读 · 2012年12月31日

低介电常数BNw/Si3N4复合透波材料研究

国家自然科学基金

0+阅读 · 2012年12月31日

表面原位生长晶须对陶瓷的润湿性及其与金属钎焊的影响机理研究

国家自然科学基金

0+阅读 · 2012年12月31日

白光LED用卤化钙和氧化钙基双掺杂发光材料的能量传递与光谱调控研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于粘滑驱动的跨尺度纳米定位运动生成机理及实现方法

国家自然科学基金

0+阅读 · 2011年12月31日

体全息光栅的制作及其改善半导体激光器光谱特性的研究

国家自然科学基金

0+阅读 · 2009年12月31日

铝/钛、铝/钢及铝/铜异种合金激光深熔钎焊机理及工艺

国家自然科学基金

0+阅读 · 2008年12月31日

金属铝-氮化铝-氧化锆复相材料的制备与性能研究

国家自然科学基金

0+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员