Differential privacy (DP) -- a principled approach to producing statistical data products with strong, mathematically provable privacy guarantees for the individuals in the underlying dataset -- has seen substantial adoption in practice over the past decade. Applying DP requires making several implementation decisions, each with significant impacts on data privacy and/or utility. Hence, to promote shared learning and accountability around DP deployments, Dwork, Kohli, and Mulligan (2019) proposed a public-facing repository ("registry") of DP deployments. The DP community has recently started to work toward realizing this vision. We contribute to this effort by (1) developing a holistic, hierarchical schema to describe any given DP deployment and (2) designing and implementing an interactive interface to act as a registry where practitioners can access information about past DP deployments. We (3) populate our interface with 21 real-world DP deployments and (4) conduct an exploratory user study with DP practitioners ($n=16$) to understand how they would use the registry, as well as what challenges and opportunities they foresee around its adoption. We find that participants were enthusiastic about the registry as a valuable resource for evaluating prior deployments and making future deployments. They also identified several opportunities for the registry, including that it can become a "hub" for the community and support broader communication around DP (e.g., to legal teams). At the same time, they identified challenges around the registry gaining adoption, including the effort and risk involved with making implementation choices public and moderating the quality of entries. Based on our findings, we offer recommendations for encouraging adoption and increasing the registry's value not only to DP practitioners, but also to policymakers, data users, and data subjects.


翻译:差分隐私(DP)——一种为底层数据集中的个体提供强有力、数学可证明隐私保障的统计数据产品生成原则性方法——在过去十年中已在实践中得到广泛采用。应用DP需要做出多项实施决策,每项决策均对数据隐私和/或效用产生重大影响。因此,为促进DP部署的共享学习与问责,Dwork、Kohli和Mulligan(2019)提出了一个面向公众的DP部署存储库(“注册表”)。DP社区近期已开始着手实现这一愿景。我们通过以下方式为此努力做出贡献:(1)开发一个全面、分层的框架来描述任意DP部署;(2)设计并实现一个交互式界面作为注册表,使从业者能够查阅过往DP部署信息。我们(3)在界面中收录了21个真实世界的DP部署案例,并(4)与DP从业者(n=16)开展探索性用户研究,以了解他们如何使用该注册表,以及预见到哪些关于其采用的挑战与机遇。研究发现,参与者对注册表作为评估既有部署和规划未来部署的宝贵资源持积极态度。他们同时指出了注册表的若干发展机遇,包括其可能成为社区的“枢纽”并支持围绕DP的更广泛沟通(例如与法务团队)。与此同时,他们也指出了注册表推广面临的挑战,包括公开实施选择所需投入的精力与风险,以及条目质量管控问题。基于研究结果,我们提出促进采用并提升注册表价值的建议,不仅面向DP从业者,也涵盖政策制定者、数据使用者及数据主体。

0
下载
关闭预览

相关内容

一种Agent自主性风险评估框架 | 最新文献
专知会员服务
16+阅读 · 10月24日
专知会员服务
41+阅读 · 2021年6月19日
Kaggle知识点:伪标签Pseudo Label
AINLP
40+阅读 · 2020年8月9日
图机器学习 2.2-2.4 Properties of Networks, Random Graph
图与推荐
10+阅读 · 2020年3月28日
RNN | RNN实践指南(2)
KingsGarden
19+阅读 · 2017年5月4日
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
VIP会员
相关资讯
相关基金
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员