The convergence of edge computing and Artificial Intelligence (AI) gives rise to Edge-AI, which enables the deployment of real-time AI applications at the network edge. A key research challenge in Edge-AI is edge inference acceleration, which aims to realize low-latency high-accuracy Deep Neural Network (DNN) inference by offloading partitioned inference tasks from end devices to edge servers. However, existing research has yet to adopt a practical Edge-AI market perspective, which would explore the personalized inference needs of AI users (e.g., inference accuracy, latency, and task complexity), the revenue incentives for AI service providers that offer edge inference services, and multi-stakeholder governance within a market-oriented context. To bridge this gap, we propose an Auction-based Edge Inference Pricing Mechanism (AERIA) for revenue maximization to tackle the multi-dimensional optimization problem of DNN model partition, edge inference pricing, and resource allocation. We develop a multi-exit device-edge synergistic inference scheme for on-demand DNN inference acceleration, and theoretically analyze the auction dynamics amongst the AI service providers, AI users and edge infrastructure provider. Owing to the strategic mechanism design via randomized consensus estimate and cost sharing techniques, the Edge-AI market attains several desirable properties. These include competitiveness in revenue maximization, incentive compatibility, and envy-freeness, which are crucial to maintain the effectiveness, truthfulness, and fairness in auction outcomes. Extensive simulations based on four representative DNN inference workloads demonstrate that AERIA significantly outperforms several state-of-the-art approaches in revenue maximization. This validates the efficacy of AERIA for on-demand DNN inference in the Edge-AI market.


翻译:边缘计算与人工智能的融合催生了边缘AI,使得在网络边缘部署实时AI应用成为可能。边缘AI中的一个关键研究挑战是边缘推理加速,其目标是通过将分割后的推理任务从终端设备卸载到边缘服务器,实现低延迟、高精度的深度神经网络推理。然而,现有研究尚未从实用的边缘AI市场视角出发,该视角将探究AI用户的个性化推理需求(如推理精度、延迟和任务复杂性)、提供边缘推理服务的AI服务提供商的收益激励,以及市场导向背景下的多利益相关方治理。为弥补这一空白,我们提出了一种基于拍卖的边缘推理定价机制,旨在通过收益最大化来解决DNN模型分割、边缘推理定价和资源分配的多维优化问题。我们开发了一种多出口设备-边缘协同推理方案,用于按需DNN推理加速,并从理论上分析了AI服务提供商、AI用户和边缘基础设施提供商之间的拍卖动态。得益于通过随机化共识估计和成本分摊技术进行的策略性机制设计,该边缘AI市场获得了若干理想特性。这些特性包括收益最大化的竞争性、激励相容性和无嫉妒性,这对于维持拍卖结果的有效性、真实性和公平性至关重要。基于四种代表性DNN推理工作负载的大量仿真表明,AERIA在收益最大化方面显著优于多种最先进方法。这验证了AERIA在边缘AI市场中用于按需DNN推理的有效性。

0
下载
关闭预览

相关内容

【ICML2024】上下文感知标记化的高效世界模型
专知会员服务
29+阅读 · 2024年7月2日
【WWW2024】博弈论式反事实解释图神经网络
专知会员服务
32+阅读 · 2024年2月17日
【ICLR2022】Vision Transformer 模型工作机制的最新理论
专知会员服务
43+阅读 · 2022年2月19日
【NeurIPS2019】图变换网络:Graph Transformer Network
专知会员服务
112+阅读 · 2019年11月25日
论文浅尝 | GEOM-GCN: Geometric Graph Convolutional Networks
开放知识图谱
14+阅读 · 2020年4月8日
图机器学习 2.2-2.4 Properties of Networks, Random Graph
图与推荐
10+阅读 · 2020年3月28日
【NeurIPS2019】图变换网络:Graph Transformer Network
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员