【资源教程】PyTorch Transformers 教程 - 专知

会员服务 ·

0

【资源教程】PyTorch Transformers 教程

2020 年 6 月 9 日 专知

【导读】Transformers是神经机器翻译中使用的一种神经网络，它主要涉及将输入序列转换为输出序列的任务。这些任务包括语音识别和文本转换语音。

Transformer中抛弃了传统的CNN和RNN，整个网络结构完全是由Attention机制组成。采用Attention机制的原因是考虑到RNN（或者LSTM，GRU等）的计算限制为是串行的，即RNN相关算法只能从左向右依次计算或者从右向左依次计算，这种机制带来了两个问题：①时间片t的计算依赖t−1时刻的计算结果，这样限制了模型的并行能力。②串行计算的过程中信息会丢失，尽管LSTM等门机制的结构一定程度上缓解了长期依赖的问题，但是对于特别长期的依赖现象，LSTM依旧无能为力。

Transformer的提出解决了上面两个问题，首先它使用了Attention机制，将序列中的任意两个位置之间的距离是缩小为一个常量；然后它使用的不是类似RNN的顺序结构，具有更好的并行性，符合现有的GPU框架。

Introduction

01

Motivation

02

Directory Structure

03

Further Watching/Reading

04

作者：Abhishek Kumar Mishra

地址连接：

https://github.com/abhimishra91/transformers-tutorials

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

0

相关内容

RNN

RNN:循环神经网络，是深度学习的一种模型。

一份循环神经网络RNNs简明教程，37页ppt

一份循环神经网络RNNs简明教程，37页ppt

专知会员服务

173+阅读 · 2020年5月6日

深度学习自然语言处理概述，216页ppt，Jindřich Helcl

深度学习自然语言处理概述，216页ppt，Jindřich Helcl

专知会员服务

216+阅读 · 2020年4月26日

Yann Lecun 纽约大学《深度学习(PyTorch)》课程(2020）PPT

Yann Lecun 纽约大学《深度学习(PyTorch)》课程(2020）PPT

专知会员服务

183+阅读 · 2020年3月16日

【上海交大-ICASSP2020】Transformer端到端的多说话人语音识别

【上海交大-ICASSP2020】Transformer端到端的多说话人语音识别

专知会员服务

51+阅读 · 2020年2月16日

Transformer文本分类代码

Transformer文本分类代码

专知会员服务

118+阅读 · 2020年2月3日

【EMNLP2019教程】图神经网络GNN的自然语言处理，附315页PPT及作者博士论文下载

【EMNLP2019教程】图神经网络GNN的自然语言处理，附315页PPT及作者博士论文下载

专知会员服务

77+阅读 · 2020年1月27日

TensorFlow Lite指南实战《TensorFlow Lite A primer》，附48页PPT

TensorFlow Lite指南实战《TensorFlow Lite A primer》，附48页PPT

专知会员服务

70+阅读 · 2020年1月17日

【书籍】深度学习框架：PyTorch入门与实践（附代码）

【书籍】深度学习框架：PyTorch入门与实践（附代码）

专知会员服务

167+阅读 · 2019年10月28日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

49+阅读 · 2019年10月17日

TensorFlow 2.0 学习资源汇总

TensorFlow 2.0 学习资源汇总

专知会员服务

67+阅读 · 2019年10月9日

【资源】NLP多标签文本分类代码实现工具包

【资源】NLP多标签文本分类代码实现工具包

专知

40+阅读 · 2019年11月20日

【资源】PyTorch上方便好用的元学习工具包

【资源】PyTorch上方便好用的元学习工具包

专知

17+阅读 · 2019年9月18日

【KDD2019】TensorFlow 2.0+NLP 最新实操教程，Google AI 130页PPT+代码

【KDD2019】TensorFlow 2.0+NLP 最新实操教程，Google AI 130页PPT+代码

专知

16+阅读 · 2019年8月20日

机器学习资源汇总(课程、教材、教程、笔记、速查等)

机器学习资源汇总(课程、教材、教程、笔记、速查等)

专知

27+阅读 · 2019年6月8日

Pytorch视频分类教程

Pytorch视频分类教程

专知

6+阅读 · 2019年5月25日

【资源推荐】复旦大学NLP上手教程

【资源推荐】复旦大学NLP上手教程

专知

41+阅读 · 2019年5月15日

【资源推荐】程序员线性代数教程，附代码实践

【资源推荐】程序员线性代数教程，附代码实践

专知

29+阅读 · 2019年5月1日

【教程】从代码中理解深度网络架构（附72页slides及代码样例下载）

【教程】从代码中理解深度网络架构（附72页slides及代码样例下载）

专知

22+阅读 · 2019年4月17日

Pytorch作者Adam Paszke-53页Pytorch教程PPT

Pytorch作者Adam Paszke-53页Pytorch教程PPT

专知

34+阅读 · 2018年10月27日

【教程】专知-PyTorch手把手深度学习教程系列完整版

【教程】专知-PyTorch手把手深度学习教程系列完整版

专知

61+阅读 · 2017年10月11日

Transformer based Grapheme-to-Phoneme Conversion

Arxiv

6+阅读 · 2020年4月14日

Data Augmentation using Pre-trained Transformer Models

Arxiv

17+阅读 · 2020年3月4日

A BERT Baseline for the Natural Questions

Arxiv

8+阅读 · 2019年3月21日

Star-Transformer

Star-Transformer

Arxiv

5+阅读 · 2019年2月28日

Neural Speech Synthesis with Transformer Network

Neural Speech Synthesis with Transformer Network

Arxiv

5+阅读 · 2019年1月30日

Music Transformer

Music Transformer

Arxiv

5+阅读 · 2018年12月12日

Close to Human Quality TTS with Transformer

Arxiv

3+阅读 · 2018年11月13日

Bidirectional Attention for SQL Generation

Bidirectional Attention for SQL Generation

Arxiv

4+阅读 · 2018年6月21日

Learning to Update for Object Tracking

Arxiv

8+阅读 · 2018年6月19日

DiSAN: Directional Self-Attention Network for RNN/CNN-Free Language Understanding

Arxiv

16+阅读 · 2017年11月20日

VIP会员

相关主题

长短期记忆网络

注意力机制

神经机器翻译

相关VIP内容

一份循环神经网络RNNs简明教程，37页ppt

一份循环神经网络RNNs简明教程，37页ppt

专知会员服务

173+阅读 · 2020年5月6日

深度学习自然语言处理概述，216页ppt，Jindřich Helcl

深度学习自然语言处理概述，216页ppt，Jindřich Helcl

专知会员服务

216+阅读 · 2020年4月26日

Yann Lecun 纽约大学《深度学习(PyTorch)》课程(2020）PPT

Yann Lecun 纽约大学《深度学习(PyTorch)》课程(2020）PPT

专知会员服务

183+阅读 · 2020年3月16日

【上海交大-ICASSP2020】Transformer端到端的多说话人语音识别

【上海交大-ICASSP2020】Transformer端到端的多说话人语音识别

专知会员服务

51+阅读 · 2020年2月16日

Transformer文本分类代码

Transformer文本分类代码

专知会员服务

118+阅读 · 2020年2月3日

【EMNLP2019教程】图神经网络GNN的自然语言处理，附315页PPT及作者博士论文下载

【EMNLP2019教程】图神经网络GNN的自然语言处理，附315页PPT及作者博士论文下载

专知会员服务

77+阅读 · 2020年1月27日

TensorFlow Lite指南实战《TensorFlow Lite A primer》，附48页PPT

TensorFlow Lite指南实战《TensorFlow Lite A primer》，附48页PPT

专知会员服务

70+阅读 · 2020年1月17日

【书籍】深度学习框架：PyTorch入门与实践（附代码）

【书籍】深度学习框架：PyTorch入门与实践（附代码）

专知会员服务

167+阅读 · 2019年10月28日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

49+阅读 · 2019年10月17日

TensorFlow 2.0 学习资源汇总

TensorFlow 2.0 学习资源汇总

专知会员服务

67+阅读 · 2019年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

联邦图学习的全面数据中心化综述

基于脉冲神经网络的边缘智能

LaCache：用于高效长上下文建模的大语言模型梯状KV缓存机制

【CMU博士论文】可解释的图与时间序列挖掘：算法与应用

相关资讯

【资源】NLP多标签文本分类代码实现工具包

【资源】NLP多标签文本分类代码实现工具包

专知

40+阅读 · 2019年11月20日

【资源】PyTorch上方便好用的元学习工具包

【资源】PyTorch上方便好用的元学习工具包

专知

17+阅读 · 2019年9月18日

【KDD2019】TensorFlow 2.0+NLP 最新实操教程，Google AI 130页PPT+代码

【KDD2019】TensorFlow 2.0+NLP 最新实操教程，Google AI 130页PPT+代码

专知

16+阅读 · 2019年8月20日

机器学习资源汇总(课程、教材、教程、笔记、速查等)

机器学习资源汇总(课程、教材、教程、笔记、速查等)

专知

27+阅读 · 2019年6月8日

Pytorch视频分类教程

Pytorch视频分类教程

专知

6+阅读 · 2019年5月25日

【资源推荐】复旦大学NLP上手教程

【资源推荐】复旦大学NLP上手教程

专知

41+阅读 · 2019年5月15日

【资源推荐】程序员线性代数教程，附代码实践

【资源推荐】程序员线性代数教程，附代码实践

专知

29+阅读 · 2019年5月1日

【教程】从代码中理解深度网络架构（附72页slides及代码样例下载）

【教程】从代码中理解深度网络架构（附72页slides及代码样例下载）

专知

22+阅读 · 2019年4月17日

Pytorch作者Adam Paszke-53页Pytorch教程PPT

Pytorch作者Adam Paszke-53页Pytorch教程PPT

专知

34+阅读 · 2018年10月27日

【教程】专知-PyTorch手把手深度学习教程系列完整版

【教程】专知-PyTorch手把手深度学习教程系列完整版

专知

61+阅读 · 2017年10月11日

相关论文

Transformer based Grapheme-to-Phoneme Conversion

Arxiv

6+阅读 · 2020年4月14日

Data Augmentation using Pre-trained Transformer Models

Arxiv

17+阅读 · 2020年3月4日

A BERT Baseline for the Natural Questions

Arxiv

8+阅读 · 2019年3月21日

Star-Transformer

Star-Transformer

Arxiv

5+阅读 · 2019年2月28日

Neural Speech Synthesis with Transformer Network

Neural Speech Synthesis with Transformer Network

Arxiv

5+阅读 · 2019年1月30日

Music Transformer

Music Transformer

Arxiv

5+阅读 · 2018年12月12日

Close to Human Quality TTS with Transformer

Arxiv

3+阅读 · 2018年11月13日

Bidirectional Attention for SQL Generation

Bidirectional Attention for SQL Generation

Arxiv

4+阅读 · 2018年6月21日

Learning to Update for Object Tracking

Arxiv

8+阅读 · 2018年6月19日

DiSAN: Directional Self-Attention Network for RNN/CNN-Free Language Understanding

Arxiv

16+阅读 · 2017年11月20日

大家都在搜

智库最新报告

久别重逢话双塔

软件无线电

无人机航拍交通事故现场勘查处置系统——行业第一的警用事故处理软件

微信扫码咨询专知VIP会员