随着深度学习在移动端的兴起,推理延迟(inference latency)已经成为在各种移动和边缘设备上运行深度神经网络(DNN)模型的一个重要指标。为此,预测DNN模型推理的延迟非常必要,尤其是对于无法在真实设备上测试延迟或者代价太高的任务,例如从巨大的模型设计空间中寻找具有延迟约束的有效的DNN模型。然而,由于不同边缘设备上运行时(runtime)的不同优化导致了模型推理延迟的巨大差异,准确预测推理延迟仍然非常具有挑战性。目前,现有方法无法实现高精度的预测。

https://air.tsinghua.edu.cn/Uploads/UEditor/Files/20210709/6376145008525256118804429.pdf

在本文中,我们提出并开发了 nn-Meter,可高效、准确地预测 DNN 模型在不同边缘设备上的推理延迟。它的关键思想是将整个模型推理划分为内核(kernel),即设备上的执行单元,然后执行内核级预测。nn-Meter 建立在两个关键技术之上:

内核检测:通过一组设计好的测试用例来自动检测模型推理的执行单元; 自适应采样:从大空间中有效地采样最有益的配置,以构建准确的内核级延迟预测器。

我们在三个常用的边缘硬件平台(移动 CPU、移动 GPU 和Intel VPU)上实现了nn-Meter系统、并使用包含26,000个模型的大型数据集进行评估,结果nn-Meter的表现明显优于先前的最好方法。

成为VIP会员查看完整内容
32

相关内容

深度神经网络(DNN)是深度学习的一种框架,它是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。
专知会员服务
18+阅读 · 2021年7月20日
专知会员服务
14+阅读 · 2021年6月16日
【WWW2021】面向时空图预测的神经结构搜索
专知会员服务
22+阅读 · 2021年4月23日
深度学习模型终端环境自适应方法研究
专知会员服务
33+阅读 · 2020年11月13日
专知会员服务
46+阅读 · 2020年8月23日
高效医疗图像分析的统一表示
专知会员服务
34+阅读 · 2020年6月23日
专知会员服务
31+阅读 · 2020年4月24日
网络宽度对深度学习模型性能有什么影响?
极市平台
15+阅读 · 2019年7月7日
深度学习与医学图像分析
人工智能前沿讲习班
40+阅读 · 2019年6月8日
Nature论文解读 | 基于深度学习和心脏影像预测生存概率
GAN生成式对抗网络
5+阅读 · 2019年2月26日
【边缘智能】边缘计算驱动的深度学习加速技术
产业智能官
20+阅读 · 2019年2月8日
如何设计基于深度学习的图像压缩算法
论智
41+阅读 · 2018年4月26日
业界 | 华为推出新型HiSR:移动端的超分辨率算法
机器之心
7+阅读 · 2017年11月24日
Arxiv
16+阅读 · 2018年2月7日
Arxiv
9+阅读 · 2016年10月27日
VIP会员
相关VIP内容
专知会员服务
18+阅读 · 2021年7月20日
专知会员服务
14+阅读 · 2021年6月16日
【WWW2021】面向时空图预测的神经结构搜索
专知会员服务
22+阅读 · 2021年4月23日
深度学习模型终端环境自适应方法研究
专知会员服务
33+阅读 · 2020年11月13日
专知会员服务
46+阅读 · 2020年8月23日
高效医疗图像分析的统一表示
专知会员服务
34+阅读 · 2020年6月23日
专知会员服务
31+阅读 · 2020年4月24日
微信扫码咨询专知VIP会员