智能下沉是迈向泛在智能时代的必经之路,也推动了端智能(On-Device Intelligence)技术的飞速发展.通过在终端设备直接部署运行深度学习模型,端智能在实时性、安全性、个性化等方面具有天然优势,已在自动驾驶、卫星侦查、虚拟现实/增强现实(Virtual Reality/Augmented Reality,VR/AR)等众多场景广泛应用.然而,随着深度学习模型参数量不断增大,端侧受限的硬件资源已难以支撑不断增长的计算开销.为提升终端设备在模型推理的计算效率,研究人员从模型算法、编译软件、设备硬件等多个层面开展了系统性优化,有效推动了端智能的发展与演进.本文从算法、软硬件结合优化等方面对现有端侧深度学习模型推理优化工作进行了总结,涵盖模型压缩技术,模型-软件-硬件的协同设计、模型异构并行部署策略以及大模型的端侧优化技术.最后,本文梳理了当前端智能推理加速技术所面临的挑战,并对未来发展趋势进行了展望.

成为VIP会员查看完整内容
2

相关内容

模型压缩,多指AI领域,多学习生成的模型进行压缩,简化,同时又要保证一定的可靠性,便于模型在低端设备上部署。
高效视觉语言模型研究综述
专知会员服务
12+阅读 · 4月18日
多模态检索增强生成综述
专知会员服务
33+阅读 · 4月15日
边缘人工智能的联邦持续学习:综合综述
专知会员服务
30+阅读 · 2024年12月14日
自动驾驶中的多智能体强化学习综述
专知会员服务
43+阅读 · 2024年8月20日
多智能体深度强化学习研究进展
专知会员服务
68+阅读 · 2024年7月17日
大型语言模型网络安全综述
专知会员服务
65+阅读 · 2024年5月12日
基于无标签视频数据的深度预测学习方法综述
专知会员服务
35+阅读 · 2022年5月16日
深度对抗视觉生成综述
专知会员服务
34+阅读 · 2021年12月29日
自动驾驶软件测试技术研究综述
专知会员服务
60+阅读 · 2021年2月19日
综述| 当图神经网络遇上强化学习
图与推荐
34+阅读 · 2022年7月1日
NLP命名实体识别开源实战教程 | 深度应用
AI100
15+阅读 · 2019年8月18日
深度学习与医学图像分析
人工智能前沿讲习班
40+阅读 · 2019年6月8日
自动驾驶汽车技术路线简介
智能交通技术
15+阅读 · 2019年4月25日
深度学习与计算机视觉任务应用综述
深度学习与NLP
50+阅读 · 2018年12月18日
干货 | 基于深度学习的目标检测算法综述
AI科技评论
18+阅读 · 2018年9月1日
最新人机对话系统简略综述
专知
26+阅读 · 2018年3月10日
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
47+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
A Survey of Large Language Models
Arxiv
461+阅读 · 2023年3月31日
Arxiv
24+阅读 · 2023年3月17日
Arxiv
68+阅读 · 2022年9月7日
Neural Architecture Search without Training
Arxiv
10+阅读 · 2021年6月11日
Arxiv
10+阅读 · 2020年11月26日
Arxiv
26+阅读 · 2020年2月21日
VIP会员
相关VIP内容
高效视觉语言模型研究综述
专知会员服务
12+阅读 · 4月18日
多模态检索增强生成综述
专知会员服务
33+阅读 · 4月15日
边缘人工智能的联邦持续学习:综合综述
专知会员服务
30+阅读 · 2024年12月14日
自动驾驶中的多智能体强化学习综述
专知会员服务
43+阅读 · 2024年8月20日
多智能体深度强化学习研究进展
专知会员服务
68+阅读 · 2024年7月17日
大型语言模型网络安全综述
专知会员服务
65+阅读 · 2024年5月12日
基于无标签视频数据的深度预测学习方法综述
专知会员服务
35+阅读 · 2022年5月16日
深度对抗视觉生成综述
专知会员服务
34+阅读 · 2021年12月29日
自动驾驶软件测试技术研究综述
专知会员服务
60+阅读 · 2021年2月19日
相关资讯
综述| 当图神经网络遇上强化学习
图与推荐
34+阅读 · 2022年7月1日
NLP命名实体识别开源实战教程 | 深度应用
AI100
15+阅读 · 2019年8月18日
深度学习与医学图像分析
人工智能前沿讲习班
40+阅读 · 2019年6月8日
自动驾驶汽车技术路线简介
智能交通技术
15+阅读 · 2019年4月25日
深度学习与计算机视觉任务应用综述
深度学习与NLP
50+阅读 · 2018年12月18日
干货 | 基于深度学习的目标检测算法综述
AI科技评论
18+阅读 · 2018年9月1日
最新人机对话系统简略综述
专知
26+阅读 · 2018年3月10日
相关基金
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
47+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
相关论文
A Survey of Large Language Models
Arxiv
461+阅读 · 2023年3月31日
Arxiv
24+阅读 · 2023年3月17日
Arxiv
68+阅读 · 2022年9月7日
Neural Architecture Search without Training
Arxiv
10+阅读 · 2021年6月11日
Arxiv
10+阅读 · 2020年11月26日
Arxiv
26+阅读 · 2020年2月21日
微信扫码咨询专知VIP会员