To bridge the ever increasing gap between deep neural networks' complexity and hardware capability, network quantization has attracted more and more research attention. The latest trend of mixed precision quantization takes advantage of hardware's multiple bit-width arithmetic operations to unleash the full potential of network quantization. However, this also results in a difficult integer programming formulation, and forces most existing approaches to use an extremely time-consuming search process even with various relaxations. Instead of solving a problem of the original integer programming, we propose to optimize a proxy metric, the concept of network orthogonality, which is highly correlated with the loss of the integer programming but also easy to optimize with linear programming. This approach reduces the search time and required data amount by orders of magnitude, with little compromise on quantization accuracy. Specifically, we achieve 72.08% Top-1 accuracy on ResNet-18 with 6.7Mb, which does not require any searching iterations. Given the high efficiency and low data dependency of our algorithm, we used it for the post-training quantization, which achieve 71.27% Top-1 accuracy on MobileNetV2 with only 1.5Mb. Our code is available at https://github.com/MAC-AutoML/OMPQ.


翻译:为了缩小深心神经网络复杂程度和硬件能力之间日益扩大的差距,网络量化吸引了越来越多的研究关注。最新趋势是混合精度分解,利用硬件多位位宽算算术操作,以释放网络量化的全部潜力。然而,这也导致一个困难的整数编程配制,迫使大多数现有方法使用耗时极高的搜索程序,即使有各种节制。我们建议,不解决原始整数编程的一个问题,而是优化替代指标,即网络或孔度概念,它与整数编程的丢失高度相关,但也容易优化线性编程。这一方法减少了搜索时间,按数量顺序要求的数据数量,而在量化精度方面几乎没有妥协。具体地说,我们用6.7Mb实现ResNet-18的72.08 % 顶端一级精确度,不需要任何搜索。鉴于我们算法的效率很高,数据依赖性也很低,我们用它来进行后培训的量化,只有1.5MMA/MACMLML/MU。我们的代码在http://mAC/MACMLMLMLA/Q上可以查阅。

0
下载
关闭预览

相关内容

专知会员服务
13+阅读 · 2021年10月13日
专知会员服务
10+阅读 · 2021年2月4日
专知会员服务
44+阅读 · 2020年10月31日
【NeurIPS2020】基于能量的分布外检测
专知会员服务
13+阅读 · 2020年10月10日
一份简单《图神经网络》教程,28页ppt
专知会员服务
123+阅读 · 2020年8月2日
机器学习相关资源(框架、库、软件)大列表
专知会员服务
39+阅读 · 2019年10月9日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
39+阅读 · 2019年10月9日
灾难性遗忘问题新视角:迁移-干扰平衡
CreateAMind
17+阅读 · 2019年7月6日
智慧交通的高精度定位技术(PPT)
智能交通技术
29+阅读 · 2019年5月1日
【泡泡一分钟】基于运动估计的激光雷达和相机标定方法
泡泡机器人SLAM
25+阅读 · 2019年1月17日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
【推荐】视频目标分割基础
机器学习研究会
9+阅读 · 2017年9月19日
已删除
将门创投
7+阅读 · 2017年7月11日
Arxiv
0+阅读 · 2022年1月26日
Arxiv
9+阅读 · 2021年2月8日
VIP会员
相关VIP内容
专知会员服务
13+阅读 · 2021年10月13日
专知会员服务
10+阅读 · 2021年2月4日
专知会员服务
44+阅读 · 2020年10月31日
【NeurIPS2020】基于能量的分布外检测
专知会员服务
13+阅读 · 2020年10月10日
一份简单《图神经网络》教程,28页ppt
专知会员服务
123+阅读 · 2020年8月2日
机器学习相关资源(框架、库、软件)大列表
专知会员服务
39+阅读 · 2019年10月9日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
39+阅读 · 2019年10月9日
相关资讯
灾难性遗忘问题新视角:迁移-干扰平衡
CreateAMind
17+阅读 · 2019年7月6日
智慧交通的高精度定位技术(PPT)
智能交通技术
29+阅读 · 2019年5月1日
【泡泡一分钟】基于运动估计的激光雷达和相机标定方法
泡泡机器人SLAM
25+阅读 · 2019年1月17日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
【推荐】视频目标分割基础
机器学习研究会
9+阅读 · 2017年9月19日
已删除
将门创投
7+阅读 · 2017年7月11日
Top
微信扫码咨询专知VIP会员