【博士论文】异构协同模型推理 - 专知VIP

会员服务 ·

20

异构计算 · 端边云协同 · 模型推理 · 任务调度 · 安全协议 ·

2024 年 11 月 19 日

【博士论文】异构协同模型推理

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

https://www.ccf.org.cn/Awards/Awards/2024-11-15/834347.shtml

模型推理是支撑诸多人工智能应用的关键，例如交通视频分析依赖于车辆检测模型推理、自然语言问答服务需要基于大语言模型推理实现。将模型推理任务部署于单一设备或同构集群上是最直接和成熟的方式，当下多数智能应用采用这种方案，例如抖音应用基于手机端上部署的视觉模型实现各种视频特效、 OpenAI 使用大规模云上 GPU 集群支撑其 ChatGPT 问答服务。然而，随着智能模型愈加复杂、应用场景不断拓宽，基于单一设备或同构集群的模型推理服务显现出很多问题：(1) 环境高度动态，多个数据源分布存在差异，因此静态的推理策略导致大量计算资源浪费；(2) 推理计算卸载引入的通信代价过高，端侧设备尤其是移动设备难以承担；(3) 纯云侧部署的模型推理协议涉及完全明文通信，存在严重的用户端数据隐私泄露风险；(4) 硬件算力受限，如智能物联网系统，单一设备无法部署完整的模型等等。由于软硬件以及部署环境的不同，模型推理任务在真实应用中不可避免地涉及多种异构设备。让这些异构设备合理地、智能地协同执行模型推理，包括协同分担计算任务、协同消除通信数据冗余、协同进行权限分离，是解决单一设备或同构集群面临的资源效率低、隐私安全保护弱等技术挑战的有效途径。因此，本工作聚焦“异构协同模型推理”，通过探索异构设备之间的协同机制，提高模型推理任务的动态自适应性、可扩展性、计算和通信效率、以及对数据隐私安全的保障。具体地，本工作研究了（1）多端协同的并发包门控，通过跨视频流协调解码资源的使用，增强视频实时分析系统中输入源的可扩展性；（2）端边协同的输入过滤，端到端地学习出如何过滤冗余的输入数据，提高通信和计算资源的利用效率；（3）端云协同的安全推理协议，以特征维度的随机置换为基础，赋予模型推理对数据和参数的安全保障；（4）边云协同的自适应模型部署，将原本孤立的模型集合构建为相互关联的模型网络，提高模型部署效率。本工作在理论上分析了所提出技术的性能保障，证明了包门控算法的在线遗憾边界、基于函数族复杂度对比的推理任务可过滤性、以及安全推理协议的隐私泄露上界，并在多个真实系统中进行验证，相较于基线方法，实现显著节省推理开销、大幅提高视频源并发度、优化通信效率等实际优化效果。关键词：异构计算端云协同模型推理任务调度安全协议。

成为VIP会员查看完整内容

32

相关内容

异构计算

【博士论文】开放集识别及其在计算机视觉中的应用

【博士论文】开放集识别及其在计算机视觉中的应用

专知会员服务

23+阅读 · 1月16日

【博士论文】面向忠实度的新型可解释性范式在自然语言处理中的应用

【博士论文】面向忠实度的新型可解释性范式在自然语言处理中的应用

专知会员服务

20+阅读 · 2024年12月24日

【博士论文】基于车载3D LiDAR的几何与语义场景理解深度学习研究

【博士论文】基于车载3D LiDAR的几何与语义场景理解深度学习研究

专知会员服务

18+阅读 · 2024年11月7日

【博士论文】高效且有效的基础大型多模态模型学习

【博士论文】高效且有效的基础大型多模态模型学习

专知会员服务

38+阅读 · 2024年10月21日

【博士论文】自然语言处理不确定估计

【博士论文】自然语言处理不确定估计

专知会员服务

22+阅读 · 2024年5月22日

【博士论文】图神经网络算法推理，135页pdf

【博士论文】图神经网络算法推理，135页pdf

专知会员服务

45+阅读 · 2024年2月23日

【迪肯大学博士论文】深度神经网络视觉推理

【迪肯大学博士论文】深度神经网络视觉推理

专知会员服务

46+阅读 · 2022年10月3日

【博士论文】基于深度学习的单目场景深度估计方法研究

【博士论文】基于深度学习的单目场景深度估计方法研究

专知会员服务

54+阅读 · 2021年12月8日

【博士论文】面向文本生成的深度序列模型研究

专知会员服务

56+阅读 · 2020年12月20日

【博士论文】解耦合的类脑计算系统栈设计

【博士论文】解耦合的类脑计算系统栈设计

专知会员服务

32+阅读 · 2020年12月14日

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

36+阅读 · 2023年4月13日

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

专知

28+阅读 · 2021年1月25日

【博士论文】搜索引擎中的实体推荐关键技术研究

【博士论文】搜索引擎中的实体推荐关键技术研究

专知

13+阅读 · 2020年12月9日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知

25+阅读 · 2020年7月26日

阿尔伯塔大学博士毕业论文：基于图结构的自然语言处理

阿尔伯塔大学博士毕业论文：基于图结构的自然语言处理

机器之心

15+阅读 · 2020年3月25日

【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络（DCRNN）

【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络（DCRNN）

专知

171+阅读 · 2019年10月28日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

76+阅读 · 2019年10月20日

论文浅尝 | 基于多模态关联数据嵌入的知识库补全

论文浅尝 | 基于多模态关联数据嵌入的知识库补全

开放知识图谱

12+阅读 · 2018年12月13日

论文浅尝 | 面向跨语言实体对齐的知识图谱与实体描述协同嵌入方法

论文浅尝 | 面向跨语言实体对齐的知识图谱与实体描述协同嵌入方法

开放知识图谱

11+阅读 · 2018年10月4日

论文浅尝 | 基于神经网络的知识推理

论文浅尝 | 基于神经网络的知识推理

开放知识图谱

14+阅读 · 2018年3月12日

正则双极值模糊推理的理论与方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

面向推荐系统中异构隐式反馈建模的迁移学习技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

9+阅读 · 2015年12月31日

网状meta分析实效性评价方法及其广义线性混合效应模型的构建与应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

共现潜在语义向量空间模型及其语义核的构建与应用研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

数据驱动的人体图像语义分割研究

国家自然科学基金

4+阅读 · 2014年12月31日

纵向数据的动态半参数建模及其统计推断

国家自然科学基金

0+阅读 · 2014年12月31日

相依回归模型与扩散过程的统计推断及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

166+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

98+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

204+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

452+阅读 · 2023年3月31日

Nature Language Reasoning, A Survey

Arxiv

76+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

166+阅读 · 2023年3月24日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

23+阅读 · 2023年1月13日

Information-theoretic generalization bounds for black-box learning algorithms

Arxiv

12+阅读 · 2021年10月4日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

19+阅读 · 2019年1月14日

VIP会员

相关主题

端边云协同

相关VIP内容

【博士论文】开放集识别及其在计算机视觉中的应用

【博士论文】开放集识别及其在计算机视觉中的应用

专知会员服务

23+阅读 · 1月16日

【博士论文】面向忠实度的新型可解释性范式在自然语言处理中的应用

【博士论文】面向忠实度的新型可解释性范式在自然语言处理中的应用

专知会员服务

20+阅读 · 2024年12月24日

【博士论文】基于车载3D LiDAR的几何与语义场景理解深度学习研究

【博士论文】基于车载3D LiDAR的几何与语义场景理解深度学习研究

专知会员服务

18+阅读 · 2024年11月7日

【博士论文】高效且有效的基础大型多模态模型学习

【博士论文】高效且有效的基础大型多模态模型学习

专知会员服务

38+阅读 · 2024年10月21日

【博士论文】自然语言处理不确定估计

【博士论文】自然语言处理不确定估计

专知会员服务

22+阅读 · 2024年5月22日

【博士论文】图神经网络算法推理，135页pdf

【博士论文】图神经网络算法推理，135页pdf

专知会员服务

45+阅读 · 2024年2月23日

【迪肯大学博士论文】深度神经网络视觉推理

【迪肯大学博士论文】深度神经网络视觉推理

专知会员服务

46+阅读 · 2022年10月3日

【博士论文】基于深度学习的单目场景深度估计方法研究

【博士论文】基于深度学习的单目场景深度估计方法研究

专知会员服务

54+阅读 · 2021年12月8日

【博士论文】面向文本生成的深度序列模型研究

专知会员服务

56+阅读 · 2020年12月20日

【博士论文】解耦合的类脑计算系统栈设计

【博士论文】解耦合的类脑计算系统栈设计

专知会员服务

32+阅读 · 2020年12月14日

热门VIP内容

开通专知VIP会员享更多权益服务

中文版 | 美国会在最终的25财年国防协议中缩减了预算目标

《发展“敏捷战斗部署”所需的作战支援任务就绪空勤人员》最新102页报告

《人工智能在决策中角色的演变》最新278页

中文版 | 近程防空系统的必要性日益凸显

相关资讯

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

36+阅读 · 2023年4月13日

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

专知

28+阅读 · 2021年1月25日

【博士论文】搜索引擎中的实体推荐关键技术研究

【博士论文】搜索引擎中的实体推荐关键技术研究

专知

13+阅读 · 2020年12月9日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知

25+阅读 · 2020年7月26日

阿尔伯塔大学博士毕业论文：基于图结构的自然语言处理

阿尔伯塔大学博士毕业论文：基于图结构的自然语言处理

机器之心

15+阅读 · 2020年3月25日

【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络（DCRNN）

【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络（DCRNN）

专知

171+阅读 · 2019年10月28日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

76+阅读 · 2019年10月20日

论文浅尝 | 基于多模态关联数据嵌入的知识库补全

论文浅尝 | 基于多模态关联数据嵌入的知识库补全

开放知识图谱

12+阅读 · 2018年12月13日

论文浅尝 | 面向跨语言实体对齐的知识图谱与实体描述协同嵌入方法

论文浅尝 | 面向跨语言实体对齐的知识图谱与实体描述协同嵌入方法

开放知识图谱

11+阅读 · 2018年10月4日

论文浅尝 | 基于神经网络的知识推理

论文浅尝 | 基于神经网络的知识推理

开放知识图谱

14+阅读 · 2018年3月12日

相关基金

正则双极值模糊推理的理论与方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

面向推荐系统中异构隐式反馈建模的迁移学习技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

9+阅读 · 2015年12月31日

网状meta分析实效性评价方法及其广义线性混合效应模型的构建与应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

共现潜在语义向量空间模型及其语义核的构建与应用研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

数据驱动的人体图像语义分割研究

国家自然科学基金

4+阅读 · 2014年12月31日

纵向数据的动态半参数建模及其统计推断

国家自然科学基金

0+阅读 · 2014年12月31日

相依回归模型与扩散过程的统计推断及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

166+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

98+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

204+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

452+阅读 · 2023年3月31日

Nature Language Reasoning, A Survey

Arxiv

76+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

166+阅读 · 2023年3月24日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

23+阅读 · 2023年1月13日

Information-theoretic generalization bounds for black-box learning algorithms

Arxiv

12+阅读 · 2021年10月4日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

19+阅读 · 2019年1月14日

微信扫码咨询专知VIP会员