清华大学刘云新获MobiSys 2021 最佳论文奖：精准预测深度学习模型在边缘设备上的推理延迟 - 专知VIP

会员服务 ·

6

深度神经网络 · 边缘计算 · 推理延迟 ·

2021 年 7 月 17 日

清华大学刘云新获MobiSys 2021 最佳论文奖：精准预测深度学习模型在边缘设备上的推理延迟

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

随着深度学习在移动端的兴起，推理延迟（inference latency）已经成为在各种移动和边缘设备上运行深度神经网络（DNN）模型的一个重要指标。为此，预测DNN模型推理的延迟非常必要，尤其是对于无法在真实设备上测试延迟或者代价太高的任务，例如从巨大的模型设计空间中寻找具有延迟约束的有效的DNN模型。然而，由于不同边缘设备上运行时（runtime）的不同优化导致了模型推理延迟的巨大差异，准确预测推理延迟仍然非常具有挑战性。目前，现有方法无法实现高精度的预测。

https://air.tsinghua.edu.cn/Uploads/UEditor/Files/20210709/6376145008525256118804429.pdf

在本文中，我们提出并开发了 nn-Meter，可高效、准确地预测 DNN 模型在不同边缘设备上的推理延迟。它的关键思想是将整个模型推理划分为内核（kernel），即设备上的执行单元，然后执行内核级预测。nn-Meter 建立在两个关键技术之上：

内核检测：通过一组设计好的测试用例来自动检测模型推理的执行单元；自适应采样：从大空间中有效地采样最有益的配置，以构建准确的内核级延迟预测器。

我们在三个常用的边缘硬件平台（移动 CPU、移动 GPU 和Intel VPU）上实现了nn-Meter系统、并使用包含26,000个模型的大型数据集进行评估，结果nn-Meter的表现明显优于先前的最好方法。

成为VIP会员查看完整内容

33

相关内容

深度神经网络

深度神经网络

深度神经网络（DNN）是深度学习的一种框架，它是一种具备至少一个隐层的神经网络。与浅层神经网络类似，深度神经网络也能够为复杂非线性系统提供建模，但多出的层次为模型提供了更高的抽象层次，因而提高了模型的能力。

【KDD2021】设备-云协同学习的推荐系统

专知会员服务

19+阅读 · 2021年7月20日

【KDD2021】基于深度置信度感知学习的广告投放探索方案

专知会员服务

15+阅读 · 2021年6月16日

【KDD2021】基于神经结构搜索的任务无关与自适应BERT压缩

专知会员服务

9+阅读 · 2021年6月5日

【WWW2021】面向时空图预测的神经结构搜索

【WWW2021】面向时空图预测的神经结构搜索

专知会员服务

23+阅读 · 2021年4月23日

深度学习模型终端环境自适应方法研究

深度学习模型终端环境自适应方法研究

专知会员服务

34+阅读 · 2020年11月13日

【爱丁堡博士论文】深度神经移动网络，Deep Neural Mobile Networking

【爱丁堡博士论文】深度神经移动网络，Deep Neural Mobile Networking

专知会员服务

20+阅读 · 2020年11月12日

【KDD2020-Tutorial】数据驱动无止境学习问答系统，142页PPT

专知会员服务

47+阅读 · 2020年8月23日

高效医疗图像分析的统一表示

高效医疗图像分析的统一表示

专知会员服务

36+阅读 · 2020年6月23日

YOLOv4 重磅来袭！俄罗斯小哥带来新一代快速高效检测器

专知会员服务

32+阅读 · 2020年4月24日

【CVPR2020-清华大学】分辨率自适应网络的有效推理，Resolution Adaptive Networks

【CVPR2020-清华大学】分辨率自适应网络的有效推理，Resolution Adaptive Networks

专知会员服务

22+阅读 · 2020年3月17日

今日 Paper | 不确定性量化；边缘感知深度预测；双目深度估计；自适应深度立体匹配等

今日 Paper | 不确定性量化；边缘感知深度预测；双目深度估计；自适应深度立体匹配等

AI科技评论

3+阅读 · 2020年3月17日

旷视研究院张祥雨：高效轻量级深度模型的研究与实践

旷视研究院张祥雨：高效轻量级深度模型的研究与实践

极市平台

4+阅读 · 2019年9月16日

200～1000+fps！谷歌公布亚毫秒级人脸检测算法BlazeFace，面向移动GPU

200～1000+fps！谷歌公布亚毫秒级人脸检测算法BlazeFace，面向移动GPU

极市平台

14+阅读 · 2019年7月22日

网络宽度对深度学习模型性能有什么影响？

网络宽度对深度学习模型性能有什么影响？

极市平台

15+阅读 · 2019年7月7日

深度学习与医学图像分析

深度学习与医学图像分析

人工智能前沿讲习班

40+阅读 · 2019年6月8日

Nature论文解读 | 基于深度学习和心脏影像预测生存概率

Nature论文解读 | 基于深度学习和心脏影像预测生存概率

GAN生成式对抗网络

5+阅读 · 2019年2月26日

【边缘智能】边缘计算驱动的深度学习加速技术

【边缘智能】边缘计算驱动的深度学习加速技术

产业智能官

20+阅读 · 2019年2月8日

如何设计基于深度学习的图像压缩算法

如何设计基于深度学习的图像压缩算法

论智

41+阅读 · 2018年4月26日

清华大学与腾讯AI合作推出Pose2Seg：无需目标检测即对人像进行分割

清华大学与腾讯AI合作推出Pose2Seg：无需目标检测即对人像进行分割

论智

8+阅读 · 2018年4月8日

业界 | 华为推出新型HiSR：移动端的超分辨率算法

业界 | 华为推出新型HiSR：移动端的超分辨率算法

机器之心

7+阅读 · 2017年11月24日

From micro-OPs to abstract resources: constructing a simpler CPU performance model through microbenchmarking

Arxiv

0+阅读 · 2021年9月16日

Knowledge Distillation and Student-Teacher Learning for Visual Intelligence: A Review and New Outlooks

Knowledge Distillation and Student-Teacher Learning for Visual Intelligence: A Review and New Outlooks

Arxiv

13+阅读 · 2020年4月13日

Exploring Categorical Regularization for Domain Adaptive Object Detection

Exploring Categorical Regularization for Domain Adaptive Object Detection

Arxiv

5+阅读 · 2020年3月20日

Pre-trained Language Model Representations for Language Generation

Arxiv

5+阅读 · 2019年4月1日

Graph Convolutional Neural Networks for Web-Scale Recommender Systems

Arxiv

14+阅读 · 2018年6月6日

Ripple Network: Propagating User Preferences on the Knowledge Graph for Recommender Systems

Arxiv

14+阅读 · 2018年5月19日

Incorporating Dictionaries into Deep Neural Networks for the Chinese Clinical Named Entity Recognition

Arxiv

12+阅读 · 2018年4月13日

Visual Interpretability for Deep Learning: a Survey

Arxiv

16+阅读 · 2018年2月7日

Large-Scale Object Discovery and Detector Adaptation from Unlabeled Video

Arxiv

3+阅读 · 2017年12月23日

VQA: Visual Question Answering

Arxiv

9+阅读 · 2016年10月27日

VIP会员

相关主题

深度神经网络

相关VIP内容

【KDD2021】设备-云协同学习的推荐系统

专知会员服务

19+阅读 · 2021年7月20日

【KDD2021】基于深度置信度感知学习的广告投放探索方案

专知会员服务

15+阅读 · 2021年6月16日

【KDD2021】基于神经结构搜索的任务无关与自适应BERT压缩

专知会员服务

9+阅读 · 2021年6月5日

【WWW2021】面向时空图预测的神经结构搜索

【WWW2021】面向时空图预测的神经结构搜索

专知会员服务

23+阅读 · 2021年4月23日

深度学习模型终端环境自适应方法研究

深度学习模型终端环境自适应方法研究

专知会员服务

34+阅读 · 2020年11月13日

【爱丁堡博士论文】深度神经移动网络，Deep Neural Mobile Networking

【爱丁堡博士论文】深度神经移动网络，Deep Neural Mobile Networking

专知会员服务

20+阅读 · 2020年11月12日

【KDD2020-Tutorial】数据驱动无止境学习问答系统，142页PPT

专知会员服务

47+阅读 · 2020年8月23日

高效医疗图像分析的统一表示

高效医疗图像分析的统一表示

专知会员服务

36+阅读 · 2020年6月23日

YOLOv4 重磅来袭！俄罗斯小哥带来新一代快速高效检测器

专知会员服务

32+阅读 · 2020年4月24日

【CVPR2020-清华大学】分辨率自适应网络的有效推理，Resolution Adaptive Networks

【CVPR2020-清华大学】分辨率自适应网络的有效推理，Resolution Adaptive Networks

专知会员服务

22+阅读 · 2020年3月17日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】以人为中心的强化学习

任务规划与地形分析：现代复杂环境作战导航体系

认知优势：人工智能在国家安全决策中的核心作用

大模型赋能的具身智能：决策与具身学习综述

相关资讯

今日 Paper | 不确定性量化；边缘感知深度预测；双目深度估计；自适应深度立体匹配等

今日 Paper | 不确定性量化；边缘感知深度预测；双目深度估计；自适应深度立体匹配等

AI科技评论

3+阅读 · 2020年3月17日

旷视研究院张祥雨：高效轻量级深度模型的研究与实践

旷视研究院张祥雨：高效轻量级深度模型的研究与实践

极市平台

4+阅读 · 2019年9月16日

200～1000+fps！谷歌公布亚毫秒级人脸检测算法BlazeFace，面向移动GPU

200～1000+fps！谷歌公布亚毫秒级人脸检测算法BlazeFace，面向移动GPU

极市平台

14+阅读 · 2019年7月22日

网络宽度对深度学习模型性能有什么影响？

网络宽度对深度学习模型性能有什么影响？

极市平台

15+阅读 · 2019年7月7日

深度学习与医学图像分析

深度学习与医学图像分析

人工智能前沿讲习班

40+阅读 · 2019年6月8日

Nature论文解读 | 基于深度学习和心脏影像预测生存概率

Nature论文解读 | 基于深度学习和心脏影像预测生存概率

GAN生成式对抗网络

5+阅读 · 2019年2月26日

【边缘智能】边缘计算驱动的深度学习加速技术

【边缘智能】边缘计算驱动的深度学习加速技术

产业智能官

20+阅读 · 2019年2月8日

如何设计基于深度学习的图像压缩算法

如何设计基于深度学习的图像压缩算法

论智

41+阅读 · 2018年4月26日

清华大学与腾讯AI合作推出Pose2Seg：无需目标检测即对人像进行分割

清华大学与腾讯AI合作推出Pose2Seg：无需目标检测即对人像进行分割

论智

8+阅读 · 2018年4月8日

业界 | 华为推出新型HiSR：移动端的超分辨率算法

业界 | 华为推出新型HiSR：移动端的超分辨率算法

机器之心

7+阅读 · 2017年11月24日

相关论文

From micro-OPs to abstract resources: constructing a simpler CPU performance model through microbenchmarking

Arxiv

0+阅读 · 2021年9月16日

Knowledge Distillation and Student-Teacher Learning for Visual Intelligence: A Review and New Outlooks

Knowledge Distillation and Student-Teacher Learning for Visual Intelligence: A Review and New Outlooks

Arxiv

13+阅读 · 2020年4月13日

Exploring Categorical Regularization for Domain Adaptive Object Detection

Exploring Categorical Regularization for Domain Adaptive Object Detection

Arxiv

5+阅读 · 2020年3月20日

Pre-trained Language Model Representations for Language Generation

Arxiv

5+阅读 · 2019年4月1日

Graph Convolutional Neural Networks for Web-Scale Recommender Systems

Arxiv

14+阅读 · 2018年6月6日

Ripple Network: Propagating User Preferences on the Knowledge Graph for Recommender Systems

Arxiv

14+阅读 · 2018年5月19日

Incorporating Dictionaries into Deep Neural Networks for the Chinese Clinical Named Entity Recognition

Arxiv

12+阅读 · 2018年4月13日

Visual Interpretability for Deep Learning: a Survey

Arxiv

16+阅读 · 2018年2月7日

Large-Scale Object Discovery and Detector Adaptation from Unlabeled Video

Arxiv

3+阅读 · 2017年12月23日

VQA: Visual Question Answering

Arxiv

9+阅读 · 2016年10月27日

微信扫码咨询专知VIP会员