《图Transformer网络与语音识别》Facebook语音大牛Awni Hannun，附121页Slides与视频 - 专知VIP

会员服务 ·

5

语音识别 · Transformer · 图神经网络 ·

2021 年 6 月 26 日

《图Transformer网络与语音识别》Facebook语音大牛Awni Hannun，附121页Slides与视频

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

摘要

我们介绍了使用神经模型的语音识别问题，强调了当输入和输出序列的长度不同时，训练和推理的CTC损失。

我们讨论了在推理过程中使用的beam搜索，以及如何使用图Transformer网络（Graph Transformer Network）在训练时对该过程进行建模。图Transformer网络基本上是带有自动微分的加权有限状态自动机，它允许我们将先验编码到图中。有不同类型的加权有限状态和不同的操作，包括并集、克林闭包、交、合成和前向得分。损失函数通常是函数之间的区别。我们可以很容易地实现这些网络使用GTN库。

地址：

https://atcold.github.io/NYU-DLSP21/en/week11/11/

成为VIP会员查看完整内容

33

相关内容

语音识别

语音识别是计算机科学和计算语言学的一个跨学科子领域，它发展了一些方法和技术，使计算机可以将口语识别和翻译成文本。它也被称为自动语音识别（ASR），计算机语音识别或语音转文本（STT）。它整合了计算机科学，语言学和计算机工程领域的知识和研究。

复旦最新「Transformers全面综述」论文，40页pdf概述Transformers各种变体模型与应用

复旦最新「Transformers全面综述」论文，40页pdf概述Transformers各种变体模型与应用

专知会员服务

194+阅读 · 2021年6月10日

【NAACL2021】长序列自然语言处理, 250页ppt

【NAACL2021】长序列自然语言处理, 250页ppt

专知会员服务

62+阅读 · 2021年6月7日

东京大学 | TrTr：基于Transformer的目标跟踪

专知会员服务

36+阅读 · 2021年5月12日

从视频到语言: 视频标题生成与描述研究综述论文(中文版)，23页pdf

从视频到语言: 视频标题生成与描述研究综述论文(中文版)，23页pdf

专知会员服务

44+阅读 · 2021年1月21日

【EMNLP2020】高性能自然语言处理，274页ppt详述最新Transformer等技术进展

【EMNLP2020】高性能自然语言处理，274页ppt详述最新Transformer等技术进展

专知会员服务

61+阅读 · 2020年11月21日

自然语言处理中的注意力机制，Attention in Natural Language Processing

自然语言处理中的注意力机制，Attention in Natural Language Processing

专知会员服务

136+阅读 · 2020年5月30日

【伯克利】通过增大模型加速Transformer训练和推理

专知会员服务

45+阅读 · 2020年3月6日

如何构建多模态BERT? 这份UNC76页《LXMERT: 从Transformer学习跨模态编码表示》PPT告诉您，附论文代码

如何构建多模态BERT? 这份UNC76页《LXMERT: 从Transformer学习跨模态编码表示》PPT告诉您，附论文代码

专知会员服务

85+阅读 · 2020年2月27日

微软亚洲研究院新论文-《多模态预训练语言模型UniViLM》面向多模态理解和生成的统一视频和语言预训练模型

微软亚洲研究院新论文-《多模态预训练语言模型UniViLM》面向多模态理解和生成的统一视频和语言预训练模型

专知会员服务

109+阅读 · 2020年2月19日

【上海交大-ICASSP2020】Transformer端到端的多说话人语音识别

【上海交大-ICASSP2020】Transformer端到端的多说话人语音识别

专知会员服务

51+阅读 · 2020年2月16日

【NeurIPS2019】图变换网络：Graph Transformer Network

【NeurIPS2019】图变换网络：Graph Transformer Network

专知

245+阅读 · 2019年11月18日

深度学习的下一步：Transformer和注意力机制

深度学习的下一步：Transformer和注意力机制

云头条

56+阅读 · 2019年9月14日

谷歌NIPS论文Transformer模型解读：只要Attention就够了

谷歌NIPS论文Transformer模型解读：只要Attention就够了

AI100

14+阅读 · 2019年9月9日

使用RNN-Transducer进行语音识别建模【附PPT与视频资料】

使用RNN-Transducer进行语音识别建模【附PPT与视频资料】

人工智能前沿讲习班

74+阅读 · 2019年1月29日

【学生论坛】详解记忆增强神经网络

【学生论坛】详解记忆增强神经网络

中国科学院自动化研究所

105+阅读 · 2018年11月15日

谷歌官方：反向传播算法图解

谷歌官方：反向传播算法图解

新智元

9+阅读 · 2018年6月29日

Yann LeCun爆惊人言论：深度学习已死？

Yann LeCun爆惊人言论：深度学习已死？

雷锋网

7+阅读 · 2018年1月7日

如何用 RNN 实现语音识别？| 分享总结

如何用 RNN 实现语音识别？| 分享总结

AI研习社

3+阅读 · 2017年12月15日

吴恩达学生Awni Hannun：图文演示如何用CTC进行序列建模（下）

吴恩达学生Awni Hannun：图文演示如何用CTC进行序列建模（下）

论智

8+阅读 · 2017年12月4日

吴恩达学生Awni Hannun：图文演示如何用CTC进行序列建模（上）

吴恩达学生Awni Hannun：图文演示如何用CTC进行序列建模（上）

论智

10+阅读 · 2017年12月3日

A Survey of Transformers

Arxiv

103+阅读 · 2021年6月8日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

Path Planning using Neural A* Search

Arxiv

5+阅读 · 2021年2月8日

A Survey on Visual Transformer

Arxiv

19+阅读 · 2020年12月23日

Pre-trained Models for Natural Language Processing: A Survey

Arxiv

113+阅读 · 2020年3月18日

Graph Transformer Networks

Arxiv

15+阅读 · 2020年2月5日

Exploring the Semantics for Visual Relationship Detection

Arxiv

3+阅读 · 2019年4月3日

Neural Speech Synthesis with Transformer Network

Neural Speech Synthesis with Transformer Network

Arxiv

5+阅读 · 2019年1月30日

Syllable-Based Sequence-to-Sequence Speech Recognition with the Transformer in Mandarin Chinese

Arxiv

5+阅读 · 2018年6月4日

Natural Language Guided Visual Relationship Detection

Arxiv

3+阅读 · 2017年11月21日

VIP会员

相关主题

图神经网络

相关VIP内容

复旦最新「Transformers全面综述」论文，40页pdf概述Transformers各种变体模型与应用

复旦最新「Transformers全面综述」论文，40页pdf概述Transformers各种变体模型与应用

专知会员服务

194+阅读 · 2021年6月10日

【NAACL2021】长序列自然语言处理, 250页ppt

【NAACL2021】长序列自然语言处理, 250页ppt

专知会员服务

62+阅读 · 2021年6月7日

东京大学 | TrTr：基于Transformer的目标跟踪

专知会员服务

36+阅读 · 2021年5月12日

从视频到语言: 视频标题生成与描述研究综述论文(中文版)，23页pdf

从视频到语言: 视频标题生成与描述研究综述论文(中文版)，23页pdf

专知会员服务

44+阅读 · 2021年1月21日

【EMNLP2020】高性能自然语言处理，274页ppt详述最新Transformer等技术进展

【EMNLP2020】高性能自然语言处理，274页ppt详述最新Transformer等技术进展

专知会员服务

61+阅读 · 2020年11月21日

自然语言处理中的注意力机制，Attention in Natural Language Processing

自然语言处理中的注意力机制，Attention in Natural Language Processing

专知会员服务

136+阅读 · 2020年5月30日

【伯克利】通过增大模型加速Transformer训练和推理

专知会员服务

45+阅读 · 2020年3月6日

如何构建多模态BERT? 这份UNC76页《LXMERT: 从Transformer学习跨模态编码表示》PPT告诉您，附论文代码

如何构建多模态BERT? 这份UNC76页《LXMERT: 从Transformer学习跨模态编码表示》PPT告诉您，附论文代码

专知会员服务

85+阅读 · 2020年2月27日

微软亚洲研究院新论文-《多模态预训练语言模型UniViLM》面向多模态理解和生成的统一视频和语言预训练模型

微软亚洲研究院新论文-《多模态预训练语言模型UniViLM》面向多模态理解和生成的统一视频和语言预训练模型

专知会员服务

109+阅读 · 2020年2月19日

【上海交大-ICASSP2020】Transformer端到端的多说话人语音识别

【上海交大-ICASSP2020】Transformer端到端的多说话人语音识别

专知会员服务

51+阅读 · 2020年2月16日

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关资讯

【NeurIPS2019】图变换网络：Graph Transformer Network

【NeurIPS2019】图变换网络：Graph Transformer Network

专知

245+阅读 · 2019年11月18日

深度学习的下一步：Transformer和注意力机制

深度学习的下一步：Transformer和注意力机制

云头条

56+阅读 · 2019年9月14日

谷歌NIPS论文Transformer模型解读：只要Attention就够了

谷歌NIPS论文Transformer模型解读：只要Attention就够了

AI100

14+阅读 · 2019年9月9日

使用RNN-Transducer进行语音识别建模【附PPT与视频资料】

使用RNN-Transducer进行语音识别建模【附PPT与视频资料】

人工智能前沿讲习班

74+阅读 · 2019年1月29日

【学生论坛】详解记忆增强神经网络

【学生论坛】详解记忆增强神经网络

中国科学院自动化研究所

105+阅读 · 2018年11月15日

谷歌官方：反向传播算法图解

谷歌官方：反向传播算法图解

新智元

9+阅读 · 2018年6月29日

Yann LeCun爆惊人言论：深度学习已死？

Yann LeCun爆惊人言论：深度学习已死？

雷锋网

7+阅读 · 2018年1月7日

如何用 RNN 实现语音识别？| 分享总结

如何用 RNN 实现语音识别？| 分享总结

AI研习社

3+阅读 · 2017年12月15日

吴恩达学生Awni Hannun：图文演示如何用CTC进行序列建模（下）

吴恩达学生Awni Hannun：图文演示如何用CTC进行序列建模（下）

论智

8+阅读 · 2017年12月4日

吴恩达学生Awni Hannun：图文演示如何用CTC进行序列建模（上）

吴恩达学生Awni Hannun：图文演示如何用CTC进行序列建模（上）

论智

10+阅读 · 2017年12月3日

相关论文

A Survey of Transformers

Arxiv

103+阅读 · 2021年6月8日

Transformer Tracking

Arxiv

17+阅读 · 2021年3月29日

Path Planning using Neural A* Search

Arxiv

5+阅读 · 2021年2月8日

A Survey on Visual Transformer

Arxiv

19+阅读 · 2020年12月23日

Pre-trained Models for Natural Language Processing: A Survey

Arxiv

113+阅读 · 2020年3月18日

Graph Transformer Networks

Arxiv

15+阅读 · 2020年2月5日

Exploring the Semantics for Visual Relationship Detection

Arxiv

3+阅读 · 2019年4月3日

Neural Speech Synthesis with Transformer Network

Neural Speech Synthesis with Transformer Network

Arxiv

5+阅读 · 2019年1月30日

Syllable-Based Sequence-to-Sequence Speech Recognition with the Transformer in Mandarin Chinese

Arxiv

5+阅读 · 2018年6月4日

Natural Language Guided Visual Relationship Detection

Arxiv

3+阅读 · 2017年11月21日

微信扫码咨询专知VIP会员