通过新的WFST类型变化的CTC变化 (CTC Variations Through New WFST Topologies) - 专知论文

会员服务 ·

0

可约的 · Weight · 回退 · 模型评估 · 有向 ·

2021 年 10 月 6 日

CTC Variations Through New WFST Topologies

翻译：通过新的WFST类型变化的CTC变化

Aleksandr Laptev,Somshubra Majumdar,Boris Ginsburg

from arxiv, Submitted to ICASSP 2022, 5 pages, 2 figures, 7 tables

This paper presents novel Weighted Finite-State Transducer (WFST) topologies to implement Connectionist Temporal Classification (CTC)-like algorithms for automatic speech recognition. Three new CTC variants are proposed: (1) the "compact-CTC", in which direct transitions between units are replaced with <epsilon> back-off transitions; (2) the "minimal-CTC", that only adds <blank> self-loops when used in WFST-composition; and (3) "selfless-CTC", that disallows self-loop for non-blank units. The new CTC variants have several benefits, such as reducing decoding graph size and GPU memory required for training while keeping model accuracy.

翻译：本文介绍了实施连接时间分类(CTC)类似算法以自动语音识别的新颖的“重力有限国家转换器(WFST)”表层,提出了三个新的CTC变体:(1)“Compact-CTC”,用<epsilon>后端转换取代各单元之间的直接转换;(2)“Minmal-CTC”,在WFST组合中只增加“blank”自滑体;(3)“没有自我的CTC”,不允许非blank单元的自我循环。新的CTC变体有若干好处,例如减少解码图形大小和训练所需的GPU记忆,同时保持模型的准确性。

0

相关内容

可约的

【干货书】计算机科学家的数学，153页pdf

【干货书】计算机科学家的数学，153页pdf

专知会员服务

174+阅读 · 2021年7月27日

【经典书】应用离散结构，568页pdf

专知会员服务

84+阅读 · 2021年5月4日

自然语言处理现代方法，176页pdf

自然语言处理现代方法，176页pdf

专知会员服务

269+阅读 · 2021年2月22日

【干货书】机器学习速查手册，135页pdf

【干货书】机器学习速查手册，135页pdf

专知会员服务

127+阅读 · 2020年11月20日

神经网络序列数据建模，229页ppt，Modeling Sequential Data with Neural Nets

神经网络序列数据建模，229页ppt，Modeling Sequential Data with Neural Nets

专知会员服务

67+阅读 · 2020年7月25日

少标签数据学习，54页ppt

少标签数据学习，54页ppt

专知会员服务

204+阅读 · 2020年5月22日

【跨语言BERT模型大集合】Transfer learning is increasingly going multilingual with language-specific BERT models

专知会员服务

54+阅读 · 2020年1月30日

【MIT】大型元学习数据集（Supplementary Materials for Niseko: a Large-ScaleMeta-Learning Dataset），麻省理工学院博士| Zeyuan Shang

【MIT】大型元学习数据集（Supplementary Materials for Niseko: a Large-ScaleMeta-Learning Dataset），麻省理工学院博士| Zeyuan Shang

专知会员服务

15+阅读 · 2019年12月24日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

49+阅读 · 2019年10月17日

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

专知会员服务

36+阅读 · 2019年10月17日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

TCN v2 + 3Dconv 运动信息

TCN v2 + 3Dconv 运动信息

CreateAMind

4+阅读 · 2019年1月8日

无监督元学习表示学习

无监督元学习表示学习

CreateAMind

27+阅读 · 2019年1月4日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

视觉机械臂 visual-pushing-grasping

视觉机械臂 visual-pushing-grasping

CreateAMind

3+阅读 · 2018年5月25日

Hierarchical Disentangled Representations

Hierarchical Disentangled Representations

CreateAMind

4+阅读 · 2018年4月15日

MoCoGAN 分解运动和内容的视频生成

MoCoGAN 分解运动和内容的视频生成

CreateAMind

18+阅读 · 2017年10月21日

【推荐】图像分类必读开创性论文汇总

【推荐】图像分类必读开创性论文汇总

机器学习研究会

14+阅读 · 2017年8月15日

语音识别之--扑朔迷“离”

语音识别之--扑朔迷“离”

微信AI

6+阅读 · 2017年8月9日

Auto-Encoding GAN

Auto-Encoding GAN

CreateAMind

7+阅读 · 2017年8月4日

Topologically Regularized Data Embeddings

Arxiv

0+阅读 · 2021年12月1日

Approximating Length-Restricted Means under Dynamic Time Warping

Arxiv

0+阅读 · 2021年12月1日

Optimizing for In-memory Deep Learning with Emerging Memory Technology

Arxiv

0+阅读 · 2021年12月1日

On the Complexity of Weight-Dynamic Network Algorithms

Arxiv

0+阅读 · 2021年11月29日

A Logic for Monitoring Dynamic Networks of Spatially-distributed Cyber-Physical Systems

Arxiv

0+阅读 · 2021年11月25日

Contrastive Clustering

Arxiv

31+阅读 · 2020年9月21日

Meta-Learning to Cluster

Meta-Learning to Cluster

Arxiv

17+阅读 · 2019年10月30日

Scaling Neural Machine Translation

Arxiv

3+阅读 · 2018年6月1日

Zero-Shot Sketch-Image Hashing

Arxiv

5+阅读 · 2018年3月6日

Learning Intrinsic Sparse Structures within Long Short-Term Memory

Arxiv

4+阅读 · 2018年1月30日

VIP会员

文章信息

相关主题

相关VIP内容

【干货书】计算机科学家的数学，153页pdf

【干货书】计算机科学家的数学，153页pdf

专知会员服务

174+阅读 · 2021年7月27日

【经典书】应用离散结构，568页pdf

专知会员服务

84+阅读 · 2021年5月4日

自然语言处理现代方法，176页pdf

自然语言处理现代方法，176页pdf

专知会员服务

269+阅读 · 2021年2月22日

【干货书】机器学习速查手册，135页pdf

【干货书】机器学习速查手册，135页pdf

专知会员服务

127+阅读 · 2020年11月20日

神经网络序列数据建模，229页ppt，Modeling Sequential Data with Neural Nets

神经网络序列数据建模，229页ppt，Modeling Sequential Data with Neural Nets

专知会员服务

67+阅读 · 2020年7月25日

少标签数据学习，54页ppt

少标签数据学习，54页ppt

专知会员服务

204+阅读 · 2020年5月22日

【跨语言BERT模型大集合】Transfer learning is increasingly going multilingual with language-specific BERT models

专知会员服务

54+阅读 · 2020年1月30日

【MIT】大型元学习数据集（Supplementary Materials for Niseko: a Large-ScaleMeta-Learning Dataset），麻省理工学院博士| Zeyuan Shang

【MIT】大型元学习数据集（Supplementary Materials for Niseko: a Large-ScaleMeta-Learning Dataset），麻省理工学院博士| Zeyuan Shang

专知会员服务

15+阅读 · 2019年12月24日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

49+阅读 · 2019年10月17日

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

专知会员服务

36+阅读 · 2019年10月17日

热门VIP内容

开通专知VIP会员享更多权益服务

《复合人工智能决策优势：面向军事行动的人类数字孪生智能体编队与群体建模》最新文献

中文版《整合蓝绿作战域：北约空陆一体化向多域作战演进》2025最新资料

演进中的空中力量指挥控制体系

《在轨空间目标多智能体检测的制导、导航与控制》195页

相关资讯

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

TCN v2 + 3Dconv 运动信息

TCN v2 + 3Dconv 运动信息

CreateAMind

4+阅读 · 2019年1月8日

无监督元学习表示学习

无监督元学习表示学习

CreateAMind

27+阅读 · 2019年1月4日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

视觉机械臂 visual-pushing-grasping

视觉机械臂 visual-pushing-grasping

CreateAMind

3+阅读 · 2018年5月25日

Hierarchical Disentangled Representations

Hierarchical Disentangled Representations

CreateAMind

4+阅读 · 2018年4月15日

MoCoGAN 分解运动和内容的视频生成

MoCoGAN 分解运动和内容的视频生成

CreateAMind

18+阅读 · 2017年10月21日

【推荐】图像分类必读开创性论文汇总

【推荐】图像分类必读开创性论文汇总

机器学习研究会

14+阅读 · 2017年8月15日

语音识别之--扑朔迷“离”

语音识别之--扑朔迷“离”

微信AI

6+阅读 · 2017年8月9日

Auto-Encoding GAN

Auto-Encoding GAN

CreateAMind

7+阅读 · 2017年8月4日

相关论文

Topologically Regularized Data Embeddings

Arxiv

0+阅读 · 2021年12月1日

Approximating Length-Restricted Means under Dynamic Time Warping

Arxiv

0+阅读 · 2021年12月1日

Optimizing for In-memory Deep Learning with Emerging Memory Technology

Arxiv

0+阅读 · 2021年12月1日

On the Complexity of Weight-Dynamic Network Algorithms

Arxiv

0+阅读 · 2021年11月29日

A Logic for Monitoring Dynamic Networks of Spatially-distributed Cyber-Physical Systems

Arxiv

0+阅读 · 2021年11月25日

Contrastive Clustering

Arxiv

31+阅读 · 2020年9月21日

Meta-Learning to Cluster

Meta-Learning to Cluster

Arxiv

17+阅读 · 2019年10月30日

Scaling Neural Machine Translation

Arxiv

3+阅读 · 2018年6月1日

Zero-Shot Sketch-Image Hashing

Arxiv

5+阅读 · 2018年3月6日

Learning Intrinsic Sparse Structures within Long Short-Term Memory

Arxiv

4+阅读 · 2018年1月30日

微信扫码咨询专知VIP会员