我们考虑在分布在用户设备上的私有数据上建立训练模型。为了确保隐私,我们添加了设备上的噪声,并使用安全聚合,以便只向服务器显示噪声和。我们提出了一个全面的端到端系统,在执行安全聚合之前适当地离散数据并添加离散高斯噪声。我们提供了一种新的离散高斯和的隐私分析方法,并仔细分析了数据量化和模求和算法的影响。我们的理论保证强调了沟通、隐私和准确性之间的复杂张力。我们广泛的实验结果表明,我们的解决方案基本上能够以低于16位精度的每个值匹配中心差分隐私的精度。
https://arxiv.org/abs/2102.06387