Social media and other platforms rely on automated detection of abusive content to help combat disinformation, harassment, and abuse. One common approach is to check user content for similarity against a server-side database of problematic items. However, such method fundamentally endangers user privacy. Instead, we target client-side detection, notifying only the users when such matches occur to warn them against abusive content. Our solution is based on privacy-preserving similarity testing. Existing approaches rely on expensive cryptographic protocols that do not scale well to large databases and may sacrifice the correctness of the matching. To contend with this challenge, we propose and formalize the concept of similarity-based bucketization(SBB). With SBB, a client reveals a small amount of information to a database-holding server so that it can generate a bucket of potentially similar items. The bucket is small enough for efficient application of privacy-preserving protocols for similarity. To analyze the privacy risk of the revealed information, we introduce a reasoning framework that measures an adversary's ability to infer a predicate about the client input with good confidence. We develop a practical SBB protocol for image content, and evaluate its client privacy guarantee with real-world social media data. We then combine the protocol with various similarity protocols, showing that SBB provides a speedup of at least 29x on large-scale databases, while retaining correctness of over 95%.


翻译:社交媒体和其他平台依靠自动检测滥用内容来帮助打击虚假信息、骚扰和虐待。一个共同的方法是对照一个有问题的服务器端数据库来检查用户内容的相似性。但是,这种方法从根本上危及用户隐私。相反,我们瞄准客户端的检测,只在出现匹配时通知用户,以警告他们不受滥用内容;我们的解决办法是以隐私保护的类似性测试为基础。现有方法依靠昂贵的加密协议,这些协议规模不及大型数据库,可能牺牲匹配的正确性。为了应对这一挑战,我们提议并正式确定基于类似性的桶化(SBB)概念。用SBB,客户向一个持有数据库的服务器披露少量信息,以便它能够生成一个可能相似的桶。这个桶小到足以有效应用隐私保护协议的类似性测试。为了分析披露信息的隐私风险,我们引入了一个逻辑框架,用以衡量对手以良好信任的方式推断客户投入的前提。我们随后开发了一个基于类似性的SBB协议(SB)内容的实用性协议,并评估其客户隐私性小于一个数据库的桶,从而将真实性与SBB(S-x)的大规模存储速度结合起来。

0
下载
关闭预览

相关内容

最新《联邦学习Federated Learning》报告,Federated Learning
专知会员服务
86+阅读 · 2020年12月2日
【Google】平滑对抗训练,Smooth Adversarial Training
专知会员服务
47+阅读 · 2020年7月4日
【google】监督对比学习,Supervised Contrastive Learning
专知会员服务
31+阅读 · 2020年4月23日
【干货书】真实机器学习,264页pdf,Real-World Machine Learning
强化学习最新教程,17页pdf
专知会员服务
171+阅读 · 2019年10月11日
机器学习入门的经验与建议
专知会员服务
91+阅读 · 2019年10月10日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
逆强化学习-学习人先验的动机
CreateAMind
15+阅读 · 2019年1月18日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
【SIGIR2018】五篇对抗训练文章
专知
12+阅读 · 2018年7月9日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Arxiv
0+阅读 · 2021年10月27日
Arxiv
0+阅读 · 2021年10月26日
Arxiv
1+阅读 · 2021年10月24日
VIP会员
相关VIP内容
最新《联邦学习Federated Learning》报告,Federated Learning
专知会员服务
86+阅读 · 2020年12月2日
【Google】平滑对抗训练,Smooth Adversarial Training
专知会员服务
47+阅读 · 2020年7月4日
【google】监督对比学习,Supervised Contrastive Learning
专知会员服务
31+阅读 · 2020年4月23日
【干货书】真实机器学习,264页pdf,Real-World Machine Learning
强化学习最新教程,17页pdf
专知会员服务
171+阅读 · 2019年10月11日
机器学习入门的经验与建议
专知会员服务
91+阅读 · 2019年10月10日
Top
微信扫码咨询专知VIP会员