推断时动态网络适应 (Dynamic Network Adaptation at Inference) - 专知论文

会员服务 ·

0

模型评估 · Networking · Neural Networks · 推断 · 特化 ·

2022 年 4 月 18 日

Dynamic Network Adaptation at Inference

翻译：推断时动态网络适应

Daniel Mendoza,Caroline Trippel

Machine learning (ML) inference is a real-time workload that must comply with strict Service Level Objectives (SLOs), including latency and accuracy targets. Unfortunately, ensuring that SLOs are not violated in inference-serving systems is challenging due to inherent model accuracy-latency tradeoffs, SLO diversity across and within application domains, evolution of SLOs over time, unpredictable query patterns, and co-location interference. In this paper, we observe that neural networks exhibit high degrees of per-input activation sparsity during inference. . Thus, we propose SLO-Aware Neural Networks which dynamically drop out nodes per-inference query, thereby tuning the amount of computation performed, according to specified SLO optimization targets and machine utilization. SLO-Aware Neural Networks achieve average speedups of $1.3-56.7\times$ with little to no accuracy loss (less than 0.3%). When accuracy constrained, SLO-Aware Neural Networks are able to serve a range of accuracy targets at low latency with the same trained model. When latency constrained, SLO-Aware Neural Networks can proactively alleviate latency degradation from co-location interference while maintaining high accuracy to meet latency constraints.

翻译：机器学习(ML)推断是一项实时工作量,必须符合严格的服务级目标(SLOs),包括长期性和准确性指标。不幸的是,由于固有的模型精确度偏差、应用领域之间和内部的 SLO多样性、SLO时间的演变、不可预测的查询模式和合用地点的干扰,确保SLO不受违反,这具有挑战性,因为在推断期间神经网络中,必须符合严格的服务级目标(SLOs),包括隐蔽性和准确性指标。因此,我们提议SLO-A软件神经网络,这些网络能动态地退出节点/perinference查询,从而根据规定的SLO优化目标和机器利用情况调整计算数量。 SLO-A软件神经网络平均速度增速1.3-56.7美元,几乎不会造成准确性损失(低于0.3 % ) 。在精确度受限时,SLO-A软件神经网络能够以同一经过训练的模式在低纬度处提供一系列准确性目标。当延缓度限制时,SLO-A软件网络能够保持高度降低度的干扰度,同时保持高度稳定度稳定度稳定度,同时保持高度稳定度稳定度,同时保持高度限制,同时保持高度神经网络可以满足高度。

0

相关内容

模型评估

机器学习系统设计系统评估标准

【干货书】机器学习速查手册，135页pdf

【干货书】机器学习速查手册，135页pdf

专知会员服务

127+阅读 · 2020年11月20日

图像分割二十年，盘点影响力最大的10篇论文

专知会员服务

84+阅读 · 2020年9月27日

【新书：机器学习简介】《A Concise Introduction to Machine Learning》by A.C. Faul (CRC 2019)

【新书：机器学习简介】《A Concise Introduction to Machine Learning》by A.C. Faul (CRC 2019)

专知会员服务

77+阅读 · 2020年2月8日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

49+阅读 · 2019年10月17日

Deep Learning Based Detection and Correction of Cardiac MR Motion Artefacts During Reconstruction for High-Quality Segmentation

Deep Learning Based Detection and Correction of Cardiac MR Motion Artefacts During Reconstruction for High-Quality Segmentation

专知会员服务

59+阅读 · 2019年10月17日

Keras François Chollet 《Deep Learning with Python 》, 386页pdf

Keras François Chollet 《Deep Learning with Python 》, 386页pdf

专知会员服务

160+阅读 · 2019年10月12日

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

专知会员服务

83+阅读 · 2019年10月9日

【加州大学伯克利分校博士论文】通过自我监督预测学习泛化

【加州大学伯克利分校博士论文】通过自我监督预测学习泛化

专知会员服务

65+阅读 · 2019年10月9日

【哈佛大学商学院课程Fall 2019】机器学习可解释性

【哈佛大学商学院课程Fall 2019】机器学习可解释性

专知会员服务

105+阅读 · 2019年10月9日

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

专知会员服务

41+阅读 · 2019年10月9日

VCIP 2022 Call for Special Session Proposals

VCIP 2022 Call for Special Session Proposals

CCF多媒体专委会

1+阅读 · 2022年4月1日

IEEE ICKG 2022: Call for Papers

IEEE ICKG 2022: Call for Papers

机器学习与推荐算法

3+阅读 · 2022年3月30日

ACM TOMM Call for Papers

ACM TOMM Call for Papers

CCF多媒体专委会

2+阅读 · 2022年3月23日

AIART 2022 Call for Papers

AIART 2022 Call for Papers

CCF多媒体专委会

1+阅读 · 2022年2月13日

【ICIG2021】Check out the hot new trailer of ICIG2021 Symposium8

【ICIG2021】Check out the hot new trailer of ICIG2021 Symposium8

中国图象图形学学会CSIG

0+阅读 · 2021年11月16日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

无监督元学习表示学习

无监督元学习表示学习

CreateAMind

27+阅读 · 2019年1月4日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

Capsule Networks解析

Capsule Networks解析

机器学习研究会

11+阅读 · 2017年11月12日

牛磺酸抑制AS肉鸡右心肥大过程中calpains介导细胞凋亡作用的研究

国家自然科学基金

0+阅读 · 2015年12月31日

头穴丛刺法调控脑缺血后星形胶质细胞活化对神经元保护的研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于SURE/PURE准则的图像盲反卷积算法研究

国家自然科学基金

3+阅读 · 2013年12月31日

基于自适应精确Cosserat弹性杆的导丝动力学交互研究

国家自然科学基金

0+阅读 · 2013年12月31日

磁流变-气浮复合驱动精密运动平台的非线性刚度与可控阻尼的协调致稳特性及控制策略研究

国家自然科学基金

0+阅读 · 2012年12月31日

金属间化合物强动力学效应对非晶转变的作用机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

移动Ad Hoc网络中支持协作通信的媒体访问控制跨层设计理论研究

国家自然科学基金

0+阅读 · 2012年12月31日

BMP-7经MEK/ERK通路上调CXCR4表达促进BM-MSCs向缺血再灌注肾脏归巢的作用研究

国家自然科学基金

0+阅读 · 2012年12月31日

热效应下形状记忆合金驱动的磁流变传动机理与应用

国家自然科学基金

0+阅读 · 2011年12月31日

数据中心的光交换及节能调度算法设计

国家自然科学基金

0+阅读 · 2011年12月31日

How Do Vision Transformers Work?

Arxiv

1+阅读 · 2022年6月8日

Adaptive Neural Network-based Unscented Kalman Filter for Spacecraft Pose Tracking at Rendezvous

Arxiv

0+阅读 · 2022年6月8日

Selective Network Linearization for Efficient Private Inference

Arxiv

0+阅读 · 2022年6月8日

Parametric Chordal Sparsity for SDP-based Neural Network Verification

Arxiv

0+阅读 · 2022年6月7日

FDGNN: Fully Dynamic Graph Neural Network

Arxiv

0+阅读 · 2022年6月7日

FedRel: An Adaptive Federated Relevance Framework for Spatial Temporal Graph Learning

Arxiv

0+阅读 · 2022年6月7日

Tutel: Adaptive Mixture-of-Experts at Scale

Arxiv

0+阅读 · 2022年6月7日

Towards Group Learning: Distributed Weighting of Experts

Arxiv

0+阅读 · 2022年6月3日

A Survey of Quantization Methods for Efficient Neural Network Inference

Arxiv

22+阅读 · 2021年6月21日

Hierarchical Graph Pooling with Structure Learning

Arxiv

13+阅读 · 2019年11月14日

VIP会员

文章信息

相关主题

Neural Networks

相关VIP内容

【干货书】机器学习速查手册，135页pdf

【干货书】机器学习速查手册，135页pdf

专知会员服务

127+阅读 · 2020年11月20日

图像分割二十年，盘点影响力最大的10篇论文

专知会员服务

84+阅读 · 2020年9月27日

【新书：机器学习简介】《A Concise Introduction to Machine Learning》by A.C. Faul (CRC 2019)

【新书：机器学习简介】《A Concise Introduction to Machine Learning》by A.C. Faul (CRC 2019)

专知会员服务

77+阅读 · 2020年2月8日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

49+阅读 · 2019年10月17日

Deep Learning Based Detection and Correction of Cardiac MR Motion Artefacts During Reconstruction for High-Quality Segmentation

Deep Learning Based Detection and Correction of Cardiac MR Motion Artefacts During Reconstruction for High-Quality Segmentation

专知会员服务

59+阅读 · 2019年10月17日

Keras François Chollet 《Deep Learning with Python 》, 386页pdf

Keras François Chollet 《Deep Learning with Python 》, 386页pdf

专知会员服务

160+阅读 · 2019年10月12日

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

专知会员服务

83+阅读 · 2019年10月9日

【加州大学伯克利分校博士论文】通过自我监督预测学习泛化

【加州大学伯克利分校博士论文】通过自我监督预测学习泛化

专知会员服务

65+阅读 · 2019年10月9日

【哈佛大学商学院课程Fall 2019】机器学习可解释性

【哈佛大学商学院课程Fall 2019】机器学习可解释性

专知会员服务

105+阅读 · 2019年10月9日

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

专知会员服务

41+阅读 · 2019年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

《复杂工程系统模型驱动设计决策支持系统：早期设计阶段挑战》最新138页

《日本陆上自卫队2040年作战方式与未来作战研究》最新23页slides

人工智能作为战争武器

《后勤保障》最新23页

相关资讯

VCIP 2022 Call for Special Session Proposals

VCIP 2022 Call for Special Session Proposals

CCF多媒体专委会

1+阅读 · 2022年4月1日

IEEE ICKG 2022: Call for Papers

IEEE ICKG 2022: Call for Papers

机器学习与推荐算法

3+阅读 · 2022年3月30日

ACM TOMM Call for Papers

ACM TOMM Call for Papers

CCF多媒体专委会

2+阅读 · 2022年3月23日

AIART 2022 Call for Papers

AIART 2022 Call for Papers

CCF多媒体专委会

1+阅读 · 2022年2月13日

【ICIG2021】Check out the hot new trailer of ICIG2021 Symposium8

【ICIG2021】Check out the hot new trailer of ICIG2021 Symposium8

中国图象图形学学会CSIG

0+阅读 · 2021年11月16日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

无监督元学习表示学习

无监督元学习表示学习

CreateAMind

27+阅读 · 2019年1月4日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

Capsule Networks解析

Capsule Networks解析

机器学习研究会

11+阅读 · 2017年11月12日

相关论文

How Do Vision Transformers Work?

Arxiv

1+阅读 · 2022年6月8日

Adaptive Neural Network-based Unscented Kalman Filter for Spacecraft Pose Tracking at Rendezvous

Arxiv

0+阅读 · 2022年6月8日

Selective Network Linearization for Efficient Private Inference

Arxiv

0+阅读 · 2022年6月8日

Parametric Chordal Sparsity for SDP-based Neural Network Verification

Arxiv

0+阅读 · 2022年6月7日

FDGNN: Fully Dynamic Graph Neural Network

Arxiv

0+阅读 · 2022年6月7日

FedRel: An Adaptive Federated Relevance Framework for Spatial Temporal Graph Learning

Arxiv

0+阅读 · 2022年6月7日

Tutel: Adaptive Mixture-of-Experts at Scale

Arxiv

0+阅读 · 2022年6月7日

Towards Group Learning: Distributed Weighting of Experts

Arxiv

0+阅读 · 2022年6月3日

A Survey of Quantization Methods for Efficient Neural Network Inference

Arxiv

22+阅读 · 2021年6月21日

Hierarchical Graph Pooling with Structure Learning

Arxiv

13+阅读 · 2019年11月14日

相关基金

牛磺酸抑制AS肉鸡右心肥大过程中calpains介导细胞凋亡作用的研究

国家自然科学基金

0+阅读 · 2015年12月31日

头穴丛刺法调控脑缺血后星形胶质细胞活化对神经元保护的研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于SURE/PURE准则的图像盲反卷积算法研究

国家自然科学基金

3+阅读 · 2013年12月31日

基于自适应精确Cosserat弹性杆的导丝动力学交互研究

国家自然科学基金

0+阅读 · 2013年12月31日

磁流变-气浮复合驱动精密运动平台的非线性刚度与可控阻尼的协调致稳特性及控制策略研究

国家自然科学基金

0+阅读 · 2012年12月31日

金属间化合物强动力学效应对非晶转变的作用机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

移动Ad Hoc网络中支持协作通信的媒体访问控制跨层设计理论研究

国家自然科学基金

0+阅读 · 2012年12月31日

BMP-7经MEK/ERK通路上调CXCR4表达促进BM-MSCs向缺血再灌注肾脏归巢的作用研究

国家自然科学基金

0+阅读 · 2012年12月31日

热效应下形状记忆合金驱动的磁流变传动机理与应用

国家自然科学基金

0+阅读 · 2011年12月31日

数据中心的光交换及节能调度算法设计

国家自然科学基金

0+阅读 · 2011年12月31日

微信扫码咨询专知VIP会员