【Tutorial】计算机视觉中的Transformer，98页ppt - 专知VIP

会员服务 ·

40

Transformer · 计算机视觉 · 论文 ·

2021 年 10 月 25 日

【Tutorial】计算机视觉中的Transformer，98页ppt

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

在2017年谷歌设计了Transformer，并在NLP社区显示出了效果之后，有大量的工作专注于将其应用到计算机视觉社区。本文首先简要介绍了计算机视觉中的Transformer。然后，介绍了Transformer模型在低/高级视觉任务、模型压缩和主干设计方面的一些代表性工作。

曹越，现任微软亚洲研究院视觉计算组主管研究员，分别于2014年和2019年在清华大学软件学院获得本科和博士学位，曾于2017年获微软学者奖学金、2018年获清华大学特等奖学金。至今在CVPR、ICCV、ICLR、ICML、NeurIPS等国际会议和期刊中发表论文20余篇，其中有三篇入围PaperDigest Most Influential Papers榜单，谷歌引用五千余次。目前主要的研究兴趣是自监督学习、多模态学习以及自注意力建模。

http://yue-cao.me

成为VIP会员查看完整内容

相关内容

Transformer

Transformer是谷歌发表的论文《Attention Is All You Need》提出一种完全基于Attention的翻译架构

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【ICML2021】计算机视觉中的自注意力机制，谷歌伯克利166页ppt教程

专知会员服务

134+阅读 · 2021年7月22日

【NAACL2021】长序列自然语言处理, 250页ppt

【NAACL2021】长序列自然语言处理, 250页ppt

专知会员服务

62+阅读 · 2021年6月7日

计算机视觉中的自监督学习与注意力建模

专知会员服务

60+阅读 · 2021年4月11日

【邱锡鹏老师CIPSATT2020教程】自然语言处理中的预训练模型，149页ppt

专知会员服务

105+阅读 · 2020年11月10日

【邱锡鹏老师SMP2020教程】自然语言处理中的预训练模型，90页ppt

【邱锡鹏老师SMP2020教程】自然语言处理中的预训练模型，90页ppt

专知会员服务

123+阅读 · 2020年9月11日

Transformer模型-深度学习自然语言处理，17页ppt

Transformer模型-深度学习自然语言处理，17页ppt

专知会员服务

107+阅读 · 2020年8月30日

【MLSS2020】最新《深度学习基础》视频讲解，42页ppt

【MLSS2020】最新《深度学习基础》视频讲解，42页ppt

专知会员服务

47+阅读 · 2020年8月5日

迁移学习简明教程，11页ppt

迁移学习简明教程，11页ppt

专知会员服务

108+阅读 · 2020年8月4日

预训练语言模型BERT，Jacob Devlin斯坦福演讲PPT：BERT介绍与答疑，35页ppt

预训练语言模型BERT，Jacob Devlin斯坦福演讲PPT：BERT介绍与答疑，35页ppt

专知会员服务

112+阅读 · 2020年1月7日

【EMNLP 2019】Discreteness in Neural Natural Language Processing，神经自然语言处理中的离散性，附303页PPT免费下载

【EMNLP 2019】Discreteness in Neural Natural Language Processing，神经自然语言处理中的离散性，附303页PPT免费下载

专知会员服务

26+阅读 · 2019年11月7日

综述｜计算机视觉中的注意力机制

综述｜计算机视觉中的注意力机制

极市平台

8+阅读 · 2020年8月30日

Transformer模型-深度学习自然语言处理，17页ppt

Transformer模型-深度学习自然语言处理，17页ppt

专知

12+阅读 · 2020年8月30日

【CIKM2019教程】新加坡国立大学：基于图学习与推理的推荐系统，附133页ppt

【CIKM2019教程】新加坡国立大学：基于图学习与推理的推荐系统，附133页ppt

专知

62+阅读 · 2019年11月4日

ICCV 2019教程《面向计算机视觉的可解释机器学习》，附280页PPT下载

ICCV 2019教程《面向计算机视觉的可解释机器学习》，附280页PPT下载

专知

33+阅读 · 2019年11月1日

【复旦大学邱锡鹏老师】面向自然语言处理的深度学习基础，199页ppt

【复旦大学邱锡鹏老师】面向自然语言处理的深度学习基础，199页ppt

专知

159+阅读 · 2019年9月8日

计算机视觉中深度迁移学习，165页PPT

计算机视觉中深度迁移学习，165页PPT

专知

23+阅读 · 2019年8月18日

自注意力机制在计算机视觉中的应用

自注意力机制在计算机视觉中的应用

GAN生成式对抗网络

19+阅读 · 2018年12月20日

自注意力机制在计算机视觉中的应用【附PPT与视频资料】

自注意力机制在计算机视觉中的应用【附PPT与视频资料】

人工智能前沿讲习班

17+阅读 · 2018年12月20日

实录分享 | 计算未来轻沙龙：计算机视觉与图形学（PPT下载）

实录分享 | 计算未来轻沙龙：计算机视觉与图形学（PPT下载）

PaperWeekly

8+阅读 · 2018年12月4日

【学科发展报告】计算机视觉

【学科发展报告】计算机视觉

中国自动化学会

43+阅读 · 2018年10月12日

Efficient Visual Tracking with Exemplar Transformers

Arxiv

0+阅读 · 2021年12月17日

MST: Masked Self-Supervised Transformer for Visual Representation

Arxiv

4+阅读 · 2021年6月10日

Rethinking Semantic Segmentation from a Sequence-to-Sequence Perspective with Transformers

Arxiv

10+阅读 · 2020年12月31日

UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

Arxiv

19+阅读 · 2020年11月18日

LXMERT: Learning Cross-Modality Encoder Representations from Transformers

LXMERT: Learning Cross-Modality Encoder Representations from Transformers

Arxiv

4+阅读 · 2019年12月3日

Learning Deep Transformer Models for Machine Translation

Learning Deep Transformer Models for Machine Translation

Arxiv

3+阅读 · 2019年6月5日

Temporal Deformable Convolutional Encoder-Decoder Networks for Video Captioning

Temporal Deformable Convolutional Encoder-Decoder Networks for Video Captioning

Arxiv

6+阅读 · 2019年5月3日

Conditional BERT Contextual Augmentation

Conditional BERT Contextual Augmentation

Arxiv

8+阅读 · 2018年12月17日

You May Not Need Attention

Arxiv

4+阅读 · 2018年10月31日

End-to-End Dense Video Captioning with Masked Transformer

Arxiv

14+阅读 · 2018年4月3日

VIP会员

相关主题

计算机视觉

相关VIP内容

【ICML2021】计算机视觉中的自注意力机制，谷歌伯克利166页ppt教程

专知会员服务

134+阅读 · 2021年7月22日

【NAACL2021】长序列自然语言处理, 250页ppt

【NAACL2021】长序列自然语言处理, 250页ppt

专知会员服务

62+阅读 · 2021年6月7日

计算机视觉中的自监督学习与注意力建模

专知会员服务

60+阅读 · 2021年4月11日

【邱锡鹏老师CIPSATT2020教程】自然语言处理中的预训练模型，149页ppt

专知会员服务

105+阅读 · 2020年11月10日

【邱锡鹏老师SMP2020教程】自然语言处理中的预训练模型，90页ppt

【邱锡鹏老师SMP2020教程】自然语言处理中的预训练模型，90页ppt

专知会员服务

123+阅读 · 2020年9月11日

Transformer模型-深度学习自然语言处理，17页ppt

Transformer模型-深度学习自然语言处理，17页ppt

专知会员服务

107+阅读 · 2020年8月30日

【MLSS2020】最新《深度学习基础》视频讲解，42页ppt

【MLSS2020】最新《深度学习基础》视频讲解，42页ppt

专知会员服务

47+阅读 · 2020年8月5日

迁移学习简明教程，11页ppt

迁移学习简明教程，11页ppt

专知会员服务

108+阅读 · 2020年8月4日

预训练语言模型BERT，Jacob Devlin斯坦福演讲PPT：BERT介绍与答疑，35页ppt

预训练语言模型BERT，Jacob Devlin斯坦福演讲PPT：BERT介绍与答疑，35页ppt

专知会员服务

112+阅读 · 2020年1月7日

【EMNLP 2019】Discreteness in Neural Natural Language Processing，神经自然语言处理中的离散性，附303页PPT免费下载

【EMNLP 2019】Discreteness in Neural Natural Language Processing，神经自然语言处理中的离散性，附303页PPT免费下载

专知会员服务

26+阅读 · 2019年11月7日

热门VIP内容

开通专知VIP会员享更多权益服务

操作系统智能体：基于多模态大模型（MLLM）的通用计算设备智能体综述

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

自主人工智能：未来战争是否将是自主化的？

相关资讯

综述｜计算机视觉中的注意力机制

综述｜计算机视觉中的注意力机制

极市平台

8+阅读 · 2020年8月30日

Transformer模型-深度学习自然语言处理，17页ppt

Transformer模型-深度学习自然语言处理，17页ppt

专知

12+阅读 · 2020年8月30日

【CIKM2019教程】新加坡国立大学：基于图学习与推理的推荐系统，附133页ppt

【CIKM2019教程】新加坡国立大学：基于图学习与推理的推荐系统，附133页ppt

专知

62+阅读 · 2019年11月4日

ICCV 2019教程《面向计算机视觉的可解释机器学习》，附280页PPT下载

ICCV 2019教程《面向计算机视觉的可解释机器学习》，附280页PPT下载

专知

33+阅读 · 2019年11月1日

【复旦大学邱锡鹏老师】面向自然语言处理的深度学习基础，199页ppt

【复旦大学邱锡鹏老师】面向自然语言处理的深度学习基础，199页ppt

专知

159+阅读 · 2019年9月8日

计算机视觉中深度迁移学习，165页PPT

计算机视觉中深度迁移学习，165页PPT

专知

23+阅读 · 2019年8月18日

自注意力机制在计算机视觉中的应用

自注意力机制在计算机视觉中的应用

GAN生成式对抗网络

19+阅读 · 2018年12月20日

自注意力机制在计算机视觉中的应用【附PPT与视频资料】

自注意力机制在计算机视觉中的应用【附PPT与视频资料】

人工智能前沿讲习班

17+阅读 · 2018年12月20日

实录分享 | 计算未来轻沙龙：计算机视觉与图形学（PPT下载）

实录分享 | 计算未来轻沙龙：计算机视觉与图形学（PPT下载）

PaperWeekly

8+阅读 · 2018年12月4日

【学科发展报告】计算机视觉

【学科发展报告】计算机视觉

中国自动化学会

43+阅读 · 2018年10月12日

相关论文

Efficient Visual Tracking with Exemplar Transformers

Arxiv

0+阅读 · 2021年12月17日

MST: Masked Self-Supervised Transformer for Visual Representation

Arxiv

4+阅读 · 2021年6月10日

Rethinking Semantic Segmentation from a Sequence-to-Sequence Perspective with Transformers

Arxiv

10+阅读 · 2020年12月31日

UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

Arxiv

19+阅读 · 2020年11月18日

LXMERT: Learning Cross-Modality Encoder Representations from Transformers

LXMERT: Learning Cross-Modality Encoder Representations from Transformers

Arxiv

4+阅读 · 2019年12月3日

Learning Deep Transformer Models for Machine Translation

Learning Deep Transformer Models for Machine Translation

Arxiv

3+阅读 · 2019年6月5日

Temporal Deformable Convolutional Encoder-Decoder Networks for Video Captioning

Temporal Deformable Convolutional Encoder-Decoder Networks for Video Captioning

Arxiv

6+阅读 · 2019年5月3日

Conditional BERT Contextual Augmentation

Conditional BERT Contextual Augmentation

Arxiv

8+阅读 · 2018年12月17日

You May Not Need Attention

Arxiv

4+阅读 · 2018年10月31日

End-to-End Dense Video Captioning with Masked Transformer

Arxiv

14+阅读 · 2018年4月3日

微信扫码咨询专知VIP会员