大数据分析的一个关键挑战是如何收集大量(标记)数据。众包旨在通过聚合和估算来自广泛的客户/用户的高质量数据(如文本的情感标签)来解决这一挑战。现有的众包研究集中于设计新的方法来提高来自不可靠/嘈杂客户端的聚合数据质量。然而,迄今为止,这种众包系统的安全方面仍未得到充分的探索。我们的目标是在这项工作中填补这一缺口。具体来说,我们表明众包很容易受到数据中毒攻击,即恶意客户端提供精心制作的数据来破坏聚合数据。我们将我们所提议的数据中毒攻击规划为一个优化问题,使聚合数据的错误最大化。我们在一个合成的和两个真实的基准数据集上的评估结果表明,所提出的攻击可以显著地增加聚合数据的估计误差。我们还提出了两种防御来减少恶意客户端的影响。我们的实证结果表明,所提出的防御方法可以显著降低数据中毒攻击的估计误差。

https://www.zhuanzhi.ai/paper/d25992f7a7df3ee1468f244f05a8ba03

成为VIP会员查看完整内容
21

相关内容

大数据分析是指对规模巨大的数据进行分析。大数据可以概括为5个V, 数据量大(Volume)、速度快(Velocity)、类型多(Variety)、价值(Value)、真实性(Veracity)。
专知会员服务
33+阅读 · 2021年4月6日
【WWW2021】大规模智能手机数据的异质联邦学习
专知会员服务
43+阅读 · 2021年3月8日
【WWW2021】场矩阵分解机推荐系统
专知会员服务
32+阅读 · 2021年2月27日
【WWW2021】自监督学习上下文嵌入的异构网络链接预测
专知会员服务
40+阅读 · 2021年2月10日
专知会员服务
26+阅读 · 2021年1月21日
【WWW2021】挖掘双重情感的假新闻检测
专知会员服务
37+阅读 · 2021年1月18日
专知会员服务
65+阅读 · 2021年1月10日
专知会员服务
113+阅读 · 2020年11月16日
联邦学习安全与隐私保护研究综述
专知
12+阅读 · 2020年8月7日
模型攻击:鲁棒性联邦学习研究的最新进展
机器之心
34+阅读 · 2020年6月3日
联邦学习最新研究趋势!
AI科技评论
52+阅读 · 2020年3月12日
【联邦学习】新一代联邦学习技术及应用实战
产业智能官
5+阅读 · 2020年2月26日
网络安全威胁情报概述
计算机与网络安全
6+阅读 · 2019年8月14日
奔驰女车主同意和解,舆情分析全事件
THU数据派
10+阅读 · 2019年4月17日
网络安全 | 威胁情报、态势感知相关汇总
计算机与网络安全
3+阅读 · 2019年1月31日
边缘计算:万物互联时代新型计算模型
计算机研究与发展
14+阅读 · 2017年5月19日
Arxiv
0+阅读 · 2021年4月12日
Arxiv
16+阅读 · 2018年2月7日
VIP会员
相关VIP内容
专知会员服务
33+阅读 · 2021年4月6日
【WWW2021】大规模智能手机数据的异质联邦学习
专知会员服务
43+阅读 · 2021年3月8日
【WWW2021】场矩阵分解机推荐系统
专知会员服务
32+阅读 · 2021年2月27日
【WWW2021】自监督学习上下文嵌入的异构网络链接预测
专知会员服务
40+阅读 · 2021年2月10日
专知会员服务
26+阅读 · 2021年1月21日
【WWW2021】挖掘双重情感的假新闻检测
专知会员服务
37+阅读 · 2021年1月18日
专知会员服务
65+阅读 · 2021年1月10日
专知会员服务
113+阅读 · 2020年11月16日
相关资讯
联邦学习安全与隐私保护研究综述
专知
12+阅读 · 2020年8月7日
模型攻击:鲁棒性联邦学习研究的最新进展
机器之心
34+阅读 · 2020年6月3日
联邦学习最新研究趋势!
AI科技评论
52+阅读 · 2020年3月12日
【联邦学习】新一代联邦学习技术及应用实战
产业智能官
5+阅读 · 2020年2月26日
网络安全威胁情报概述
计算机与网络安全
6+阅读 · 2019年8月14日
奔驰女车主同意和解,舆情分析全事件
THU数据派
10+阅读 · 2019年4月17日
网络安全 | 威胁情报、态势感知相关汇总
计算机与网络安全
3+阅读 · 2019年1月31日
边缘计算:万物互联时代新型计算模型
计算机研究与发展
14+阅读 · 2017年5月19日
微信扫码咨询专知VIP会员