Increasing privacy concerns have given rise to Private Inference (PI). In PI, both the client's personal data and the service provider's trained model are kept confidential. State-of-the-art PI protocols combine several cryptographic primitives: Homomorphic Encryption (HE), Secret Sharing (SS), Garbled Circuits (GC), and Oblivious Transfer (OT). Today, PI remains largely arcane and too slow for practical use, despite the need and recent performance improvements. This paper addresses PI's shortcomings with a detailed characterization of a standard high-performance protocol to build foundational knowledge and intuition in the systems community. The characterization pinpoints all sources of inefficiency -- compute, communication, and storage. A notable aspect of this work is the use of inference request arrival rates rather than studying individual inferences in isolation. Prior to this work, and without considering arrival rate, it has been assumed that PI pre-computations can be handled offline and their overheads ignored. We show this is not the case. The offline costs in PI are so high that they are often incurred online, as there is insufficient downtime to hide pre-compute latency. We further propose three optimizations to address the computation (layer-parallel HE), communication (wireless slot allocation), and storage (Client-Garbler) overheads leveraging insights from our characterization. Compared to the state-of-the-art PI protocol, the optimizations provide a total PI speedup of 1.8$\times$, with the ability to sustain inference requests up to a 2.24$\times$ greater rate.
翻译:私隐隐隐隐隐隐隐隐隐隐隐隐隐隐隐日益引起私人推断(PI) 。 在 PI 中, 客户的个人数据和服务提供者经过培训的模型都被保密。 最先进的 PI 协议将几个加密原始源: 单式加密(HE)、 秘密共享(SS)、 腐蚀电路(GC) 和 Oblivious Transport (OT ) 合并起来。 今天, PI 仍然大为荒凉, 实际使用速度太慢, 尽管需要和最近的绩效改进 。 本文用标准高性能协议来详细描述 PI 的缺点, 以建立系统社区的基础知识和直觉。 最先进的PI 协议确定了效率的所有来源 -- -- 精密、通信和存储。 这项工作的一个显著方面是使用推论要求到达率,而不是孤立地研究个人推论。 在这项工作之前,在没有考虑抵达率的情况下, 假设 PI 之前的估算可以处理离线问题, 他们的管理被忽略。 我们没有这样做。 。 PI 的离线成本总高,, 其总的离值成本, 将 水平 水平 水平 隐藏到 水平 水平 水平 水平 水平 水平 水平 至 水平 水平 水平 水平 水平 水平 至 水平 水平 至 水平 水平 水平 水平 水平 水平 至 水平 水平 水平 水平 水平 水平 水平 水平 至 至 水平 水平 水平 水平 水平 水平 水平 水平 水平 水平 至 至 水平 水平 水平 水平 水平 水平 水平 至 至 水平 至 至 水平 水平 至 水平 水平 至 至 水平 水平 至 水平 至 至 水平 至 至 至 至 至 至 至 至 至 水平 水平 水平 水平 水平 水平 至 至 至 水平 水平 水平 至 至 至 至 水平 水平 水平 至 至 至 水平 水平 水平 水平 水平 水平 至 至 至 至 水平 水平 水平 水平 水平 水平 至 至 至 至