FQ-VT:培训后充分量化愿景变异器量化 (FQ-ViT: Post-Training Quantization for Fully Quantized Vision Transformer) - 专知论文

会员服务 ·

0

Vision · 可约的 · 推断 · 模型评估 · 变换 ·

2022 年 4 月 21 日

FQ-ViT: Post-Training Quantization for Fully Quantized Vision Transformer

翻译：FQ-VT:培训后充分量化愿景变异器量化

Yang Lin,Tianyu Zhang,Peiqin Sun,Zheng Li,Shuchang Zhou

from arxiv, Accepted by IJCAI2022

Network quantization significantly reduces model inference complexity and has been widely used in real-world deployments. However, most existing quantization methods have been developed mainly on Convolutional Neural Networks (CNN), and suffer severe degradation when applied to fully quantized vision transformers. In this work, we demonstrate that many of these difficulties arise because of serious inter-channel variation in LayerNorm inputs, and present, Power-of-Two Factor (PTF), a systematic method to reduce the performance degradation and inference complexity of fully quantized vision transformers. In addition, observing an extreme non-uniform distribution in attention maps, we propose Log-Int-Softmax (LIS) to sustain that and simplify inference by using 4-bit quantization and the BitShift operator. Comprehensive experiments on various transformer-based architectures and benchmarks show that our Fully Quantized Vision Transformer (FQ-ViT) outperforms previous works while even using lower bit-width on attention maps. For instance, we reach 84.89% top-1 accuracy with ViT-L on ImageNet and 50.8 mAP with Cascade Mask R-CNN (Swin-S) on COCO. To our knowledge, we are the first to achieve lossless accuracy degradation (~1%) on fully quantized vision transformers. Code is available at https://github.com/linyang-zhh/FQ-ViT.

翻译：网络定量化极大地降低了模型的推断复杂性,并被广泛用于现实世界的部署。然而,大多数现有量化方法主要是在进化神经网络(CNN)上开发的,在对全面量化的视觉变压器应用时会发生严重退化。在这项工作中,我们证明,许多这些困难是由于以下因素造成的:层内输入和目前的二元动力变压器(PTF)中出现严重的气道间变异,这是降低性能退化和充分量化的视觉变压器复杂性的系统方法。此外,在关注地图中看到极端的非统一分布,我们建议Log-Int-Softmax(LIS)使用四位四位四位四位四位四分化和BitShift操作器,以简化推断。关于各种基于变压器的架构和基准的全面实验表明,我们完全量化的视野变压器(FQ-VT)比以往的工程要快得多,而在关注地图上甚至使用较低的位维维维维度图。例如,我们达到了84.89%的顶级-一级-一级变压系统SAS-L在图像S-MAS-S-L QAR-de-deal-de-del-de-de-deal-deal-I-deal-S-S-deal-dexxx

0

相关内容

Vision

ICLR 2022杰出论文公布：7篇论文获得，清华朱军课题组摘得

ICLR 2022杰出论文公布：7篇论文获得，清华朱军课题组摘得

专知会员服务

60+阅读 · 2022年4月22日

“CVPR 2021 接受论文列表 1663篇论文都在这了

专知会员服务

32+阅读 · 2021年6月12日

最新《Transformers模型》教程，64页ppt

最新《Transformers模型》教程，64页ppt

专知会员服务

320+阅读 · 2020年11月26日

50+篇《神经架构搜索NAS》2020论文合集

专知会员服务

61+阅读 · 2020年3月19日

图像分类技巧集，17页ppt《Bag of Tricks for Image Classification》

图像分类技巧集，17页ppt《Bag of Tricks for Image Classification》

专知会员服务

95+阅读 · 2020年3月12日

抢鲜看！13篇CVPR2020论文链接/开源代码/解读

抢鲜看！13篇CVPR2020论文链接/开源代码/解读

专知会员服务

50+阅读 · 2020年2月26日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

49+阅读 · 2019年10月17日

Stabilizing Transformers for Reinforcement Learning

Stabilizing Transformers for Reinforcement Learning

专知会员服务

60+阅读 · 2019年10月17日

ExBert — 可视化分析Transformer学到的表示

ExBert — 可视化分析Transformer学到的表示

专知会员服务

32+阅读 · 2019年10月16日

[综述]深度学习下的场景文本检测与识别

[综述]深度学习下的场景文本检测与识别

专知会员服务

78+阅读 · 2019年10月10日

IEEE ICKG 2022: Call for Papers

IEEE ICKG 2022: Call for Papers

机器学习与推荐算法

3+阅读 · 2022年3月30日

ACM MM 2022 Call for Papers

ACM MM 2022 Call for Papers

CCF多媒体专委会

5+阅读 · 2022年3月29日

IEEE TII Call For Papers

IEEE TII Call For Papers

CCF多媒体专委会

3+阅读 · 2022年3月24日

AIART 2022 Call for Papers

AIART 2022 Call for Papers

CCF多媒体专委会

1+阅读 · 2022年2月13日

Multi-Task Learning的几篇综述文章

Multi-Task Learning的几篇综述文章

深度学习自然语言处理

15+阅读 · 2020年6月15日

RoBERTa for Chinese：大规模中文预训练RoBERTa模型

RoBERTa for Chinese：大规模中文预训练RoBERTa模型

AINLP

30+阅读 · 2019年9月8日

BERT/Transformer/迁移学习NLP资源大列表

BERT/Transformer/迁移学习NLP资源大列表

专知

19+阅读 · 2019年6月9日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

【论文推荐】最新七篇图像分割相关论文—域适应深度表示学习、循环残差卷积、二值分割、图像合成、无监督跨模态

【论文推荐】最新七篇图像分割相关论文—域适应深度表示学习、循环残差卷积、二值分割、图像合成、无监督跨模态

专知

19+阅读 · 2018年6月1日

【论文】变分推断（Variational inference)的总结

【论文】变分推断（Variational inference)的总结

机器学习研究会

39+阅读 · 2017年11月16日

内质网应激介导微囊藻毒素诱导草鱼肝细胞凋亡的机制及GRP78的调控研究

国家自然科学基金

0+阅读 · 2014年12月31日

γ-Synuclein调控MAPK-ERK-JNK信号通路及细胞周期促进子宫内膜癌恶性进展的机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

不同产区太子参次生代谢物差异机制的iTRAQ定量蛋白质组学研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于集群OFDM的低功耗电力线通信收发端设计

国家自然科学基金

0+阅读 · 2013年12月31日

Intraflagellar Transport运输纤毛蛋白的分子机理

国家自然科学基金

0+阅读 · 2012年12月31日

异构GPU集群混合粒度任务协同调度与动态均衡机制研究

国家自然科学基金

2+阅读 · 2012年12月31日

a-synuclein DNA甲基化在帕金森病发病机制中的作用及肉苁蓉总苷干预实验研究

国家自然科学基金

0+阅读 · 2012年12月31日

TRAIL协同IER3调节NF-κB信号通路介导肝癌细胞凋亡的相关机制研究

国家自然科学基金

1+阅读 · 2012年12月31日

非饱和土坡面降雨非正交入渗机理及渗流分析边界条件

国家自然科学基金

0+阅读 · 2011年12月31日

红色砂梨花青苷合成的分子机理及调控

国家自然科学基金

0+阅读 · 2010年12月31日

Exploring Plain Vision Transformer Backbones for Object Detection

Arxiv

1+阅读 · 2022年6月10日

Position Labels for Self-Supervised Vision Transformer

Arxiv

0+阅读 · 2022年6月10日

NAGphormer: Neighborhood Aggregation Graph Transformer for Node Classification in Large Graphs

Arxiv

0+阅读 · 2022年6月10日

Spatial Entropy Regularization for Vision Transformers

Arxiv

0+阅读 · 2022年6月9日

How Do Vision Transformers Work?

Arxiv

1+阅读 · 2022年6月8日

Localizing Semantic Patches for Accelerating Image Classification

Arxiv

0+阅读 · 2022年6月7日

TUNet: A Block-online Bandwidth Extension Model based on Transformers and Self-supervised Pretraining

Arxiv

0+阅读 · 2022年6月7日

Masked Autoencoders Are Scalable Vision Learners

Arxiv

27+阅读 · 2021年11月11日

GraphNorm: A Principled Approach to Accelerating Graph Neural Network Training

Arxiv

14+阅读 · 2021年2月16日

Cluster-GCN: An Efficient Algorithm for Training Deep and Large Graph Convolutional Networks

Arxiv

14+阅读 · 2019年8月8日

VIP会员

文章信息

相关主题

相关VIP内容

ICLR 2022杰出论文公布：7篇论文获得，清华朱军课题组摘得

ICLR 2022杰出论文公布：7篇论文获得，清华朱军课题组摘得

专知会员服务

60+阅读 · 2022年4月22日

“CVPR 2021 接受论文列表 1663篇论文都在这了

专知会员服务

32+阅读 · 2021年6月12日

最新《Transformers模型》教程，64页ppt

最新《Transformers模型》教程，64页ppt

专知会员服务

320+阅读 · 2020年11月26日

50+篇《神经架构搜索NAS》2020论文合集

专知会员服务

61+阅读 · 2020年3月19日

图像分类技巧集，17页ppt《Bag of Tricks for Image Classification》

图像分类技巧集，17页ppt《Bag of Tricks for Image Classification》

专知会员服务

95+阅读 · 2020年3月12日

抢鲜看！13篇CVPR2020论文链接/开源代码/解读

抢鲜看！13篇CVPR2020论文链接/开源代码/解读

专知会员服务

50+阅读 · 2020年2月26日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

49+阅读 · 2019年10月17日

Stabilizing Transformers for Reinforcement Learning

Stabilizing Transformers for Reinforcement Learning

专知会员服务

60+阅读 · 2019年10月17日

ExBert — 可视化分析Transformer学到的表示

ExBert — 可视化分析Transformer学到的表示

专知会员服务

32+阅读 · 2019年10月16日

[综述]深度学习下的场景文本检测与识别

[综述]深度学习下的场景文本检测与识别

专知会员服务

78+阅读 · 2019年10月10日

热门VIP内容

开通专知VIP会员享更多权益服务

数据驱动死亡：以色列AI战争机器如何锁定目标

【普林斯顿博士论文】通过以人为本的评估推动负责任的人工智能

ICML 2025 | BiAssemble: 双臂机器人几何拼合问题的协同可供性学习

ICML 2025杰出论文出炉：8篇获奖，南大研究者榜上有名

相关资讯

IEEE ICKG 2022: Call for Papers

IEEE ICKG 2022: Call for Papers

机器学习与推荐算法

3+阅读 · 2022年3月30日

ACM MM 2022 Call for Papers

ACM MM 2022 Call for Papers

CCF多媒体专委会

5+阅读 · 2022年3月29日

IEEE TII Call For Papers

IEEE TII Call For Papers

CCF多媒体专委会

3+阅读 · 2022年3月24日

AIART 2022 Call for Papers

AIART 2022 Call for Papers

CCF多媒体专委会

1+阅读 · 2022年2月13日

Multi-Task Learning的几篇综述文章

Multi-Task Learning的几篇综述文章

深度学习自然语言处理

15+阅读 · 2020年6月15日

RoBERTa for Chinese：大规模中文预训练RoBERTa模型

RoBERTa for Chinese：大规模中文预训练RoBERTa模型

AINLP

30+阅读 · 2019年9月8日

BERT/Transformer/迁移学习NLP资源大列表

BERT/Transformer/迁移学习NLP资源大列表

专知

19+阅读 · 2019年6月9日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

【论文推荐】最新七篇图像分割相关论文—域适应深度表示学习、循环残差卷积、二值分割、图像合成、无监督跨模态

【论文推荐】最新七篇图像分割相关论文—域适应深度表示学习、循环残差卷积、二值分割、图像合成、无监督跨模态

专知

19+阅读 · 2018年6月1日

【论文】变分推断（Variational inference)的总结

【论文】变分推断（Variational inference)的总结

机器学习研究会

39+阅读 · 2017年11月16日

相关论文

Exploring Plain Vision Transformer Backbones for Object Detection

Arxiv

1+阅读 · 2022年6月10日

Position Labels for Self-Supervised Vision Transformer

Arxiv

0+阅读 · 2022年6月10日

NAGphormer: Neighborhood Aggregation Graph Transformer for Node Classification in Large Graphs

Arxiv

0+阅读 · 2022年6月10日

Spatial Entropy Regularization for Vision Transformers

Arxiv

0+阅读 · 2022年6月9日

How Do Vision Transformers Work?

Arxiv

1+阅读 · 2022年6月8日

Localizing Semantic Patches for Accelerating Image Classification

Arxiv

0+阅读 · 2022年6月7日

TUNet: A Block-online Bandwidth Extension Model based on Transformers and Self-supervised Pretraining

Arxiv

0+阅读 · 2022年6月7日

Masked Autoencoders Are Scalable Vision Learners

Arxiv

27+阅读 · 2021年11月11日

GraphNorm: A Principled Approach to Accelerating Graph Neural Network Training

Arxiv

14+阅读 · 2021年2月16日

Cluster-GCN: An Efficient Algorithm for Training Deep and Large Graph Convolutional Networks

Arxiv

14+阅读 · 2019年8月8日

相关基金

内质网应激介导微囊藻毒素诱导草鱼肝细胞凋亡的机制及GRP78的调控研究

国家自然科学基金

0+阅读 · 2014年12月31日

γ-Synuclein调控MAPK-ERK-JNK信号通路及细胞周期促进子宫内膜癌恶性进展的机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

不同产区太子参次生代谢物差异机制的iTRAQ定量蛋白质组学研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于集群OFDM的低功耗电力线通信收发端设计

国家自然科学基金

0+阅读 · 2013年12月31日

Intraflagellar Transport运输纤毛蛋白的分子机理

国家自然科学基金

0+阅读 · 2012年12月31日

异构GPU集群混合粒度任务协同调度与动态均衡机制研究

国家自然科学基金

2+阅读 · 2012年12月31日

a-synuclein DNA甲基化在帕金森病发病机制中的作用及肉苁蓉总苷干预实验研究

国家自然科学基金

0+阅读 · 2012年12月31日

TRAIL协同IER3调节NF-κB信号通路介导肝癌细胞凋亡的相关机制研究

国家自然科学基金

1+阅读 · 2012年12月31日

非饱和土坡面降雨非正交入渗机理及渗流分析边界条件

国家自然科学基金

0+阅读 · 2011年12月31日

红色砂梨花青苷合成的分子机理及调控

国家自然科学基金

0+阅读 · 2010年12月31日

微信扫码咨询专知VIP会员