TensorFlow官方发布剪枝优化工具：参数减少80%，精度几乎不变 - 专知

会员服务 ·

0

TensorFlow官方发布剪枝优化工具：参数减少80%，精度几乎不变

2019 年 5 月 15 日 量子位

晓查编译自 Medium
量子位报道 | 公众号 QbitAI

去年TensorFlow官方推出了模型优化工具，最多能将模型尺寸减小4倍，运行速度提高3倍。

最近现又有一款新工具加入模型优化“豪华套餐”，这就是基于Keras的剪枝优化工具。

训练AI模型有时需要大量硬件资源，但不是每个人都有4个GPU的豪华配置，剪枝优化可以帮你缩小模型尺寸，以较小的代价进行推理。

什么是权重剪枝？

权重剪枝（Weight Pruning）优化，就是消除权重张量中不必要的值，减少神经网络层之间的连接数量，减少计算中涉及的参数，从而降低操作次数。

这样做的好处是压缩了网络的存储空间，尤其是稀疏张量特别适合压缩。例如，经过处理可以将MNIST的90％稀疏度模型从12MB压缩到2MB。

此外，权重剪枝与量化（quantization）兼容，从而产生复合效益。通过训练后量化（post-training quantization），还能将剪枝后的模型从2MB进一步压缩到仅0.5MB 。

TensorFlow官方承诺，将来TensorFlow Lite会增加对稀疏表示和计算的支持，从而扩展运行内存的压缩优势，并释放性能提升。

优化效果

权重剪枝优化可以用于不同任务、不同类型的模型，从图像处理的CNN用于语音处理的RNN。下表显示了其中一些实验结果。

以GNMT从德语翻译到英语的模型为例，原模型的BLEU为29.47。指定80%的稀疏度，经优化后，张量中的非零参数可以从211M压缩到44M，准确度基本没有损失。

使用方法

现在的权重剪枝API建立在Keras之上，因此开发者可以非常方便地将此技术应用于任何现有的Keras训练模型中。

开发者可以指定最终目标稀疏度（比如50%），以及执行剪枝的计划（比如2000步开始剪枝，在4000步时停止，并且每100步进行一次)，以及剪枝结构的可选配置。

import tensorflow_model_optimization as tfmot

model = build_your_model()

pruning_schedule = tfmot.sparsity.keras.PolynomialDecay(
initial_sparsity=0.0, final_sparsity=0.5,
begin_step=2000, end_step=4000)

model_for_pruning = tfmot.sparsity.keras.prune_low_magnitude(model, pruning_schedule=pruning_schedule)

…

model_for_pruning.fit(…)

△ 三个不同张量，左边的没有稀疏度，中心的有多个单独0值，右边的有1x2的稀疏块。

随着训练的进行，剪枝过程开始被执行。在这个过程中，它会消除消除张量中最接近零的权重，直到达到当前稀疏度目标。

每次计划执行剪枝程序时，都会重新计算当前稀疏度目标，根据平滑上升函数逐渐增加稀疏度来达到最终目标稀疏度，从0%开始直到结束。

用户也可以根据需要调整这个上升函数。在某些情况下，可以安排训练过程在某个步骤达到一定收敛级别之后才开始优化，或者在训练总步数之前结束剪枝，以便在达到最终目标稀疏度时进一步微调系统。

△权重张量剪枝动画，黑色的点表示非零权重，随着训练的进行，稀疏度逐渐增加

GitHub地址：

https://github.com/tensorflow/model-optimization

官方教程：
https://www.tensorflow.org/model_optimization/guide/pruning/pruning_with_keras

— 完 —

订阅AI内参，获取AI行业资讯

加入社群

量子位AI社群开始招募啦，量子位社群分：AI讨论群、AI+行业群、AI技术群；

欢迎对AI感兴趣的同学，在量子位公众号（QbitAI）对话界面回复关键字“微信群”，获取入群方式。（技术群与AI+行业群需经过审核，审核较严，敬请谅解）

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧 !

登录查看更多

11

相关内容

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

专知会员服务

70+阅读 · 2020年7月1日

【SIGIR2020-斯坦福大学】一种新的又好又快的BERT类信息检索模型-ColBERT

【SIGIR2020-斯坦福大学】一种新的又好又快的BERT类信息检索模型-ColBERT

专知会员服务

44+阅读 · 2020年4月28日

【伯克利】通过增大模型加速Transformer训练和推理

专知会员服务

45+阅读 · 2020年3月6日

TensorFlow Lite指南实战《TensorFlow Lite A primer》，附48页PPT

TensorFlow Lite指南实战《TensorFlow Lite A primer》，附48页PPT

专知会员服务

70+阅读 · 2020年1月17日

深度神经网络模型压缩与加速综述

深度神经网络模型压缩与加速综述

专知会员服务

130+阅读 · 2019年10月12日

资源 | TensorFlow推出模型优化工具包，可将模型压缩75%

资源 | TensorFlow推出模型优化工具包，可将模型压缩75%

机器之心

9+阅读 · 2018年9月24日

模型大小缩小75%，TensorFlow推出模型优化工具包

模型大小缩小75%，TensorFlow推出模型优化工具包

论智

8+阅读 · 2018年9月19日

【干货】使用TensorFlow官方Java API调用TensorFlow模型（附代码）

【干货】使用TensorFlow官方Java API调用TensorFlow模型（附代码）

专知

20+阅读 · 2018年4月22日

TensorFlow神经网络教程

TensorFlow神经网络教程

Python程序员

4+阅读 · 2017年12月4日

终于！谷歌移动端深度学习框架 TensorFlow Lite 正式发布

终于！谷歌移动端深度学习框架 TensorFlow Lite 正式发布

开源中国

3+阅读 · 2017年11月16日

Self-training with Noisy Student improves ImageNet classification

Arxiv

15+阅读 · 2019年11月11日

Meta-Learning with Implicit Gradients

Meta-Learning with Implicit Gradients

Arxiv

13+阅读 · 2019年9月10日

Doubly Attentive Transformer Machine Translation

Doubly Attentive Transformer Machine Translation

Arxiv

4+阅读 · 2018年7月30日

Bilingual Character Representation for Efficiently Addressing Out-of-Vocabulary Words in Code-Switching Named Entity Recognition

Arxiv

3+阅读 · 2018年5月30日

Deep Active Learning for Named Entity Recognition

Arxiv

15+阅读 · 2018年2月4日

VIP会员

相关主题

相关VIP内容

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

专知会员服务

70+阅读 · 2020年7月1日

【SIGIR2020-斯坦福大学】一种新的又好又快的BERT类信息检索模型-ColBERT

【SIGIR2020-斯坦福大学】一种新的又好又快的BERT类信息检索模型-ColBERT

专知会员服务

44+阅读 · 2020年4月28日

【伯克利】通过增大模型加速Transformer训练和推理

专知会员服务

45+阅读 · 2020年3月6日

TensorFlow Lite指南实战《TensorFlow Lite A primer》，附48页PPT

TensorFlow Lite指南实战《TensorFlow Lite A primer》，附48页PPT

专知会员服务

70+阅读 · 2020年1月17日

深度神经网络模型压缩与加速综述

深度神经网络模型压缩与加速综述

专知会员服务

130+阅读 · 2019年10月12日

热门VIP内容

开通专知VIP会员享更多权益服务

《利用人工智能改善军事警察行动：当下现状探索》最新95页报告

《用于适应性、任务就绪型军用仿生机器人的合成数据管道》

面向现代武装力量的高级AI驱动军事模拟与训练软件

《军事应用中的AI：建立信任》最新报告

相关资讯

资源 | TensorFlow推出模型优化工具包，可将模型压缩75%

资源 | TensorFlow推出模型优化工具包，可将模型压缩75%

机器之心

9+阅读 · 2018年9月24日

模型大小缩小75%，TensorFlow推出模型优化工具包

模型大小缩小75%，TensorFlow推出模型优化工具包

论智

8+阅读 · 2018年9月19日

【干货】使用TensorFlow官方Java API调用TensorFlow模型（附代码）

【干货】使用TensorFlow官方Java API调用TensorFlow模型（附代码）

专知

20+阅读 · 2018年4月22日

TensorFlow神经网络教程

TensorFlow神经网络教程

Python程序员

4+阅读 · 2017年12月4日

终于！谷歌移动端深度学习框架 TensorFlow Lite 正式发布

终于！谷歌移动端深度学习框架 TensorFlow Lite 正式发布

开源中国

3+阅读 · 2017年11月16日

相关论文

Self-training with Noisy Student improves ImageNet classification

Arxiv

15+阅读 · 2019年11月11日

Meta-Learning with Implicit Gradients

Meta-Learning with Implicit Gradients

Arxiv

13+阅读 · 2019年9月10日

Doubly Attentive Transformer Machine Translation

Doubly Attentive Transformer Machine Translation

Arxiv

4+阅读 · 2018年7月30日

Bilingual Character Representation for Efficiently Addressing Out-of-Vocabulary Words in Code-Switching Named Entity Recognition

Arxiv

3+阅读 · 2018年5月30日

Deep Active Learning for Named Entity Recognition

Arxiv

15+阅读 · 2018年2月4日

大家都在搜

蓝牙安全攻防

大型语言模型

分布式事务

数字图像处理

冷启动，0预算，如何借助分销裂变引爆私域用户增长？

微信扫码咨询专知VIP会员