机器学习模型受益于庞大而多样的训练数据集。然而,单个组织很难收集足够多样化的数据。此外,数据的敏感性和政府法规(如GDPR、HIPPA和CCPA)限制了组织与其他实体共享数据的方式。这迫使拥有敏感数据集的组织开发只在局部最优的模型。联邦学习(FL)通过实现在不共享敏感数据的情况下开发全局模型,促进了鲁棒的机器学习。然而,部署FL系统有两个广泛的挑战:隐私挑战和训练/性能相关的挑战。隐私方面的挑战涉及到暴露本地客户数据敏感信息的攻击。与训练/性能相关的挑战包括高沟通成本,跨客户的数据异构,以及缺乏个性化技术。为了使FL实用、可扩展和有用,必须解决所有这些问题。在这篇论文中,我讨论了我为解决这些挑战而设计的技术,并描述了我为缓解这些挑战而开发的两个系统——PrivacyFL(用于FL的隐私保护模拟器)和DynamoFL(用于FL的易于使用的生产级系统)。
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“F143” 就可以获取《【MIT博士论文】联邦学习实用方法,143页pdf》专知下载链接