Recommender systems play a crucial role in helping users to find their interested information in various web services such as Amazon, YouTube, and Google News. Various recommender systems, ranging from neighborhood-based, association-rule-based, matrix-factorization-based, to deep learning based, have been developed and deployed in industry. Among them, deep learning based recommender systems become increasingly popular due to their superior performance. In this work, we conduct the first systematic study on data poisoning attacks to deep learning based recommender systems. An attacker's goal is to manipulate a recommender system such that the attacker-chosen target items are recommended to many users. To achieve this goal, our attack injects fake users with carefully crafted ratings to a recommender system. Specifically, we formulate our attack as an optimization problem, such that the injected ratings would maximize the number of normal users to whom the target items are recommended. However, it is challenging to solve the optimization problem because it is a non-convex integer programming problem. To address the challenge, we develop multiple techniques to approximately solve the optimization problem. Our experimental results on three real-world datasets, including small and large datasets, show that our attack is effective and outperforms existing attacks. Moreover, we attempt to detect fake users via statistical analysis of the rating patterns of normal and fake users. Our results show that our attack is still effective and outperforms existing attacks even if such a detector is deployed.


翻译:推荐人系统在帮助用户在亚马逊、YouTube和Google News等各种网络服务中找到其感兴趣的信息方面发挥着关键作用。 各种推荐人系统,从街坊型、协会规则型、矩阵因素型、基深层次学习型,到行业开发并部署。 其中,深层学习型推荐人系统因其优异性能而越来越受欢迎。 在这项工作中,我们进行关于数据中毒袭击的首次系统研究,到深层学习型推荐人系统。攻击者的目标是操纵一个推荐人系统,以便向许多用户推荐攻击者选择的目标项目。为了实现这一目标,我们的攻击注射了假冒用户,精心设计了给推荐人系统的评级。具体地说,我们把攻击设计成一个优化型的问题,这样,注入的推荐人系统将最大限度地增加目标项目推荐的正常用户的数量。然而,解决优化问题的难度很大,因为这是一个非曲线组合组合式的编程问题。 为了应对挑战,我们开发了多种技术,可以大致解决最优化问题。 为了实现这一目标,我们甚至对现实世界三次袭击的实验结果,我们的实验结果,我们通过正常攻击的用户, 包括小和大比例分析, 我们的统计式的用户是模拟攻击的测试系统,我们现在的测试, 我们的测试, 测试了一个有效的攻击的系统, 我们的测试了一个有效的攻击的系统, 测试了我们现在的系统, 我们的系统, 测试了一个有效的攻击的系统, 测试了一个模拟式的系统, 测试了我们的系统, 测试了我们的系统是模拟式的模型是模拟式的系统。

1
下载
关闭预览

相关内容

推荐系统,是指根据用户的习惯、偏好或兴趣,从不断到来的大规模信息中识别满足用户兴趣的信息的过程。推荐推荐任务中的信息往往称为物品(Item)。根据具体应用背景的不同,这些物品可以是新闻、电影、音乐、广告、商品等各种对象。推荐系统利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。为了解决这些问题,个性化推荐系统应运而生。个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【干货书】真实机器学习,264页pdf,Real-World Machine Learning
开源书:PyTorch深度学习起步
专知会员服务
50+阅读 · 2019年10月11日
LibRec 精选:AutoML for Contextual Bandits
LibRec智能推荐
7+阅读 · 2019年9月19日
LibRec 精选:位置感知的长序列会话推荐
LibRec智能推荐
3+阅读 · 2019年5月17日
LibRec 精选:推荐系统的常用数据集
LibRec智能推荐
17+阅读 · 2019年2月15日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
LibRec 精选:推荐系统的论文与源码
LibRec智能推荐
14+阅读 · 2018年11月29日
【论文】图上的表示学习综述
机器学习研究会
13+阅读 · 2017年9月24日
Arxiv
0+阅读 · 2021年3月3日
Arxiv
92+阅读 · 2020年2月28日
Learning Recommender Systems from Multi-Behavior Data
Arxiv
7+阅读 · 2018年11月29日
Arxiv
9+阅读 · 2018年3月23日
Arxiv
8+阅读 · 2018年2月23日
Arxiv
9+阅读 · 2018年1月30日
VIP会员
Top
微信扫码咨询专知VIP会员