端智能推理加速技术综述 - 专知VIP

会员服务 ·

2

模型压缩 · 推理加速 · 深度学习 ·

端智能推理加速技术综述

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

智能下沉是迈向泛在智能时代的必经之路，也推动了端智能（On-Device Intelligence）技术的飞速发展.通过在终端设备直接部署运行深度学习模型，端智能在实时性、安全性、个性化等方面具有天然优势，已在自动驾驶、卫星侦查、虚拟现实/增强现实（Virtual Reality/Augmented Reality，VR/AR）等众多场景广泛应用.然而，随着深度学习模型参数量不断增大，端侧受限的硬件资源已难以支撑不断增长的计算开销.为提升终端设备在模型推理的计算效率，研究人员从模型算法、编译软件、设备硬件等多个层面开展了系统性优化，有效推动了端智能的发展与演进.本文从算法、软硬件结合优化等方面对现有端侧深度学习模型推理优化工作进行了总结，涵盖模型压缩技术，模型-软件-硬件的协同设计、模型异构并行部署策略以及大模型的端侧优化技术.最后，本文梳理了当前端智能推理加速技术所面临的挑战，并对未来发展趋势进行了展望.

成为VIP会员查看完整内容

2

相关内容

模型压缩

模型压缩，多指AI领域，多学习生成的模型进行压缩，简化，同时又要保证一定的可靠性，便于模型在低端设备上部署。

高效视觉语言模型研究综述

高效视觉语言模型研究综述

专知会员服务

12+阅读 · 4月18日

多模态检索增强生成综述

多模态检索增强生成综述

专知会员服务

33+阅读 · 4月15日

边缘人工智能的联邦持续学习：综合综述

边缘人工智能的联邦持续学习：综合综述

专知会员服务

30+阅读 · 2024年12月14日

如何高效识别新概念？香港理工等最新元素级零样本识别技术系统性综述

如何高效识别新概念？香港理工等最新元素级零样本识别技术系统性综述

专知会员服务

14+阅读 · 2024年11月28日

自动驾驶中的多智能体强化学习综述

自动驾驶中的多智能体强化学习综述

专知会员服务

43+阅读 · 2024年8月20日

多智能体深度强化学习研究进展

多智能体深度强化学习研究进展

专知会员服务

68+阅读 · 2024年7月17日

大型语言模型网络安全综述

大型语言模型网络安全综述

专知会员服务

65+阅读 · 2024年5月12日

基于无标签视频数据的深度预测学习方法综述

基于无标签视频数据的深度预测学习方法综述

专知会员服务

35+阅读 · 2022年5月16日

深度对抗视觉生成综述

深度对抗视觉生成综述

专知会员服务

34+阅读 · 2021年12月29日

自动驾驶软件测试技术研究综述

自动驾驶软件测试技术研究综述

专知会员服务

60+阅读 · 2021年2月19日

智库兰德2022最新发布《2035年新兴技术：基于典型场景的未来军事突发事件技术评估》118页研究报告

智库兰德2022最新发布《2035年新兴技术：基于典型场景的未来军事突发事件技术评估》118页研究报告

专知

43+阅读 · 2022年10月13日

综述| 当图神经网络遇上强化学习

综述| 当图神经网络遇上强化学习

图与推荐

34+阅读 · 2022年7月1日

美国兰德提出《在联合全域指挥控制中发展人工智能的路径》报告

美国兰德提出《在联合全域指挥控制中发展人工智能的路径》报告

专知

69+阅读 · 2022年4月20日

NLP命名实体识别开源实战教程 | 深度应用

NLP命名实体识别开源实战教程 | 深度应用

AI100

15+阅读 · 2019年8月18日

深度学习与医学图像分析

深度学习与医学图像分析

人工智能前沿讲习班

40+阅读 · 2019年6月8日

自动驾驶汽车技术路线简介

自动驾驶汽车技术路线简介

智能交通技术

15+阅读 · 2019年4月25日

深度学习与计算机视觉任务应用综述

深度学习与计算机视觉任务应用综述

深度学习与NLP

50+阅读 · 2018年12月18日

干货 | 基于深度学习的目标检测算法综述

干货 | 基于深度学习的目标检测算法综述

AI科技评论

18+阅读 · 2018年9月1日

最新人机对话系统简略综述

最新人机对话系统简略综述

专知

26+阅读 · 2018年3月10日

资深算法工程师万宫玺：Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 分享总结

资深算法工程师万宫玺：Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 分享总结

AI研习社

11+阅读 · 2018年1月4日

内容中心无线网络的存储和传输协作机制研究

国家自然科学基金

1+阅读 · 2017年12月31日

不确定环境下的自主移动机器人目标搜索问题研究

国家自然科学基金

43+阅读 · 2015年12月31日

面向5G移动通信系统的D2D可靠多播通信关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于MEMS加速度传感器的智能终端手势识别及三维交互模型

国家自然科学基金

6+阅读 · 2015年12月31日

大规模模糊RDF数据管理关键技术研究

国家自然科学基金

7+阅读 · 2015年12月31日

CGF战场空间认知行为建模研究

国家自然科学基金

47+阅读 · 2014年12月31日

Android移动终端多语种基础软件组合的安全技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

1+阅读 · 2014年12月31日

基于UGC的应急响应决策支持系统关键技术研究

国家自然科学基金

12+阅读 · 2014年12月31日

云计算环境下顾及用户关系的手机用户时空轨迹模式挖掘方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

210+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

461+阅读 · 2023年3月31日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

24+阅读 · 2023年1月13日

Geometric multimodal representation learning

Arxiv

68+阅读 · 2022年9月7日

Improving evidential deep learning via multi-task learning

Arxiv

11+阅读 · 2021年12月17日

Advances in adversarial attacks and defenses in computer vision: A survey

Arxiv

22+阅读 · 2021年9月2日

Neural Architecture Search without Training

Neural Architecture Search without Training

Arxiv

10+阅读 · 2021年6月11日

Meta-learning in natural and artificial intelligence

Arxiv

10+阅读 · 2020年11月26日

Few-shot acoustic event detection via meta-learning

Arxiv

26+阅读 · 2020年2月21日

VIP会员

相关主题

相关VIP内容

高效视觉语言模型研究综述

高效视觉语言模型研究综述

专知会员服务

12+阅读 · 4月18日

多模态检索增强生成综述

多模态检索增强生成综述

专知会员服务

33+阅读 · 4月15日

边缘人工智能的联邦持续学习：综合综述

边缘人工智能的联邦持续学习：综合综述

专知会员服务

30+阅读 · 2024年12月14日

如何高效识别新概念？香港理工等最新元素级零样本识别技术系统性综述

如何高效识别新概念？香港理工等最新元素级零样本识别技术系统性综述

专知会员服务

14+阅读 · 2024年11月28日

自动驾驶中的多智能体强化学习综述

自动驾驶中的多智能体强化学习综述

专知会员服务

43+阅读 · 2024年8月20日

多智能体深度强化学习研究进展

多智能体深度强化学习研究进展

专知会员服务

68+阅读 · 2024年7月17日

大型语言模型网络安全综述

大型语言模型网络安全综述

专知会员服务

65+阅读 · 2024年5月12日

基于无标签视频数据的深度预测学习方法综述

基于无标签视频数据的深度预测学习方法综述

专知会员服务

35+阅读 · 2022年5月16日

深度对抗视觉生成综述

深度对抗视觉生成综述

专知会员服务

34+阅读 · 2021年12月29日

自动驾驶软件测试技术研究综述

自动驾驶软件测试技术研究综述

专知会员服务

60+阅读 · 2021年2月19日

热门VIP内容

开通专知VIP会员享更多权益服务

2025最新报告中文版（7466字） | 俄乌战争：重塑现代战场的C4ISR体系

端智能推理加速技术综述

中文版 | 军事航空的未来：创新与技术趋势

《“忠诚僚机”设计及其融入打击机群的系统簇方法》77页报告

相关资讯

智库兰德2022最新发布《2035年新兴技术：基于典型场景的未来军事突发事件技术评估》118页研究报告

智库兰德2022最新发布《2035年新兴技术：基于典型场景的未来军事突发事件技术评估》118页研究报告

专知

43+阅读 · 2022年10月13日

综述| 当图神经网络遇上强化学习

综述| 当图神经网络遇上强化学习

图与推荐

34+阅读 · 2022年7月1日

美国兰德提出《在联合全域指挥控制中发展人工智能的路径》报告

美国兰德提出《在联合全域指挥控制中发展人工智能的路径》报告

专知

69+阅读 · 2022年4月20日

NLP命名实体识别开源实战教程 | 深度应用

NLP命名实体识别开源实战教程 | 深度应用

AI100

15+阅读 · 2019年8月18日

深度学习与医学图像分析

深度学习与医学图像分析

人工智能前沿讲习班

40+阅读 · 2019年6月8日

自动驾驶汽车技术路线简介

自动驾驶汽车技术路线简介

智能交通技术

15+阅读 · 2019年4月25日

深度学习与计算机视觉任务应用综述

深度学习与计算机视觉任务应用综述

深度学习与NLP

50+阅读 · 2018年12月18日

干货 | 基于深度学习的目标检测算法综述

干货 | 基于深度学习的目标检测算法综述

AI科技评论

18+阅读 · 2018年9月1日

最新人机对话系统简略综述

最新人机对话系统简略综述

专知

26+阅读 · 2018年3月10日

资深算法工程师万宫玺：Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 分享总结

资深算法工程师万宫玺：Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 分享总结

AI研习社

11+阅读 · 2018年1月4日

相关基金

内容中心无线网络的存储和传输协作机制研究

国家自然科学基金

1+阅读 · 2017年12月31日

不确定环境下的自主移动机器人目标搜索问题研究

国家自然科学基金

43+阅读 · 2015年12月31日

面向5G移动通信系统的D2D可靠多播通信关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于MEMS加速度传感器的智能终端手势识别及三维交互模型

国家自然科学基金

6+阅读 · 2015年12月31日

大规模模糊RDF数据管理关键技术研究

国家自然科学基金

7+阅读 · 2015年12月31日

CGF战场空间认知行为建模研究

国家自然科学基金

47+阅读 · 2014年12月31日

Android移动终端多语种基础软件组合的安全技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

1+阅读 · 2014年12月31日

基于UGC的应急响应决策支持系统关键技术研究

国家自然科学基金

12+阅读 · 2014年12月31日

云计算环境下顾及用户关系的手机用户时空轨迹模式挖掘方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

相关论文

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

210+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

461+阅读 · 2023年3月31日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

24+阅读 · 2023年1月13日

Geometric multimodal representation learning

Arxiv

68+阅读 · 2022年9月7日

Improving evidential deep learning via multi-task learning

Arxiv

11+阅读 · 2021年12月17日

Advances in adversarial attacks and defenses in computer vision: A survey

Arxiv

22+阅读 · 2021年9月2日

Neural Architecture Search without Training

Neural Architecture Search without Training

Arxiv

10+阅读 · 2021年6月11日

Meta-learning in natural and artificial intelligence

Arxiv

10+阅读 · 2020年11月26日

Few-shot acoustic event detection via meta-learning

Arxiv

26+阅读 · 2020年2月21日

微信扫码咨询专知VIP会员