腾讯优图开源人脸识别底层技术：一款深度学习推理框架TNN

会员服务 ·

腾讯优图开源人脸识别底层技术：一款深度学习推理框架TNN

2020 年 6 月 15 日 新智元

新智元报道

来源：GitHub

编辑：永上

【新智元导读】6月10日，腾讯优图实验室开源了一款深度学习推理框架TNN，高效解锁计算机视觉算法。

TNN是一款移动端推理框架，具有高性能、轻量级的特点，拥有跨平台、高性能、模型压缩、代码裁剪等众多优势。目前TNN已经在手机QQ、微视、P图等应用中落地。

TNN框架在原有Rapidnet、ncnn框架的基础上进一步加强了对移动端设备的支持，在性能方面也有所优化，同时借鉴了业界主流开源框架的优点，高性能和良好拓展性。

这次腾讯优图开源TNN，也是希望其推理框架能够进一步完善，共同为AI构建一个开放共进的生态环境，同时保持不断的迭代更新。

腾讯优图已在GitHub上开源的TNN，可以通过下面的网址进入

https://github.com/Tencent/TNN

计算优化，算力强

TNN对主流平台的适应性强，对CPU: ARMv7， ARMv8， GPU: Mali， Adreno， Apple) 深度调优。

同时优化了对移动端的适应性，轻量级，高算力。针对不同架构在硬件指令发射、吞吐、延迟、缓存带宽、缓存延迟、寄存器数量等特点，深度优化底层算子，极致利用硬件算力。

CNN 核心卷积运算通过 Winograd，Tile-GEMM， Direct Conv 等多种算法实现，保证不同参数、计算尺度下高效计算。

保证低精度优化，支持 INT8， FP16 低精度计算，减少模型大小、内存消耗，同时利用硬件低精度计算指令加速计算；支持 INT8 Winograd 算法，(输入6bit)，在精度满足要求的情况下，进一步降低模型计算复杂度；支持单模型多种精度混合计算，加速计算同时保证模型精度。

内存优化，轻量级匹配深度学习

通过 DAG 网络计算图分析，实现无计算依赖的节点间复用内存，降低 90% 内存资源消耗。同时支持外部实时指定用于网络内存，实现「多个模型，单份内存」。

TNN上手容易，三个步骤就能完成模型在目标平台上的部署。训练好的模型可以用TNN提供的工具转换成TNN模型；然后编译目标平台的TNN引擎；最后在自己的应用程序中嵌入对TNN的调用，都有详细的模型来辅助完成。

腾讯优图不断对优质项目持续开源，促进构建友好开发者生态，为中国企业的科技力量添砖加瓦。

参考链接：

https://github.com/Tencent/TNN

登录查看更多

相关内容

腾讯优图

关注 1

腾讯优图

【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型

专知会员服务

26+阅读 · 2020年5月7日

【ICASSP2020】分布式与高效深度学习，140页ppt详述深度学习压缩与联邦学习训练进展

专知会员服务

126+阅读 · 2020年5月6日

AAAI 2020 | 滴滴&东北大学提出自动结构化剪枝压缩算法框架，性能提升高达120倍

专知会员服务

30+阅读 · 2020年2月26日

TensorFlow Lite指南实战《TensorFlow Lite A primer》，附48页PPT

专知会员服务

70+阅读 · 2020年1月17日

深度神经网络模型压缩与加速综述

专知会员服务

130+阅读 · 2019年10月12日

训练速度提升超3倍！斯坦福推出全新深度学习并行计算框架FlexFlow

AI前线

7+阅读 · 2019年6月22日

分布式深度学习新进展：让“分布式”和“深度学习”真正深度融合

新智元

8+阅读 · 2018年7月8日

开源神经网络框架Caffe2全介绍

北京思腾合力科技有限公司

3+阅读 · 2017年12月12日

终于！谷歌移动端深度学习框架 TensorFlow Lite 正式发布

开源中国

3+阅读 · 2017年11月16日

开源巨献：阿里巴巴最热门29款开源项目

算法与数据结构

5+阅读 · 2017年7月14日

Few-shot Adaptive Faster R-CNN

Arxiv

3+阅读 · 2019年3月22日

Single-Image Piece-wise Planar 3D Reconstruction via Associative Embedding

Arxiv

7+阅读 · 2019年2月26日

Learning to Importance Sample in Primary Sample Space

Arxiv

5+阅读 · 2018年8月23日

ArcFace: Additive Angular Margin Loss for Deep Face Recognition

Arxiv

6+阅读 · 2018年1月23日

Caffeinated FPGAs: FPGA Framework For Convolutional Neural Networks

Arxiv

10+阅读 · 2016年9月30日

VIP会员