Fake reviews and review manipulation are growing problems on online marketplaces globally. Review Hijacking is a new review manipulation tactic in which unethical sellers "hijack" an existing product page (usually one with many positive reviews), then update the product details like title, photo, and description with those of an entirely different product. With the earlier reviews still attached, the new item appears well-reviewed. However, there are no public datasets of review hijacking and little is known in the literature about this tactic. Hence, this paper proposes a three-part study: (i) we propose a framework to generate synthetically labeled data for review hijacking by swapping products and reviews; (ii) then, we evaluate the potential of both a Twin LSTM network and BERT sequence pair classifier to distinguish legitimate reviews from hijacked ones using this data; and (iii) we then deploy the best performing model on a collection of 31K products (with 6.5 M reviews) in the original data, where we find 100s of previously unknown examples of review hijacking.


翻译:在网上市场上,虚假的审查和审查操纵正在日益成为全球范围越来越多的问题。审查劫机是一个新的审查操纵策略,不道德的卖方“劫机”现有产品页(通常有许多积极的审查),然后用完全不同的产品标题、照片和描述更新产品细节。随着早先的审查仍然附着,新的项目似乎经过了很好的审查。然而,没有关于审查劫机的公开数据集,文献对这一策略很少了解。因此,本文件提出一个三部分研究:(一) 我们提出一个框架,以生成合成标签的数据,用以通过交换产品和审查审查来审查劫机情况;(二) 然后,我们评估双子LSTM网络和BERT序列对等分类师的潜力,以区分合法审查与使用这一数据被劫持的审查;以及(三) 我们随后在原始数据中采用收集31K产品的最佳模式(6.5M审查)。 我们发现100个以前未知的审查劫机的例子。

0
下载
关闭预览

相关内容

专知会员服务
31+阅读 · 2021年6月12日
最新《自监督表示学习》报告,70页ppt
专知会员服务
85+阅读 · 2020年12月22日
【新书】Java企业微服务,Enterprise Java Microservices,272页pdf
【论文推荐】小样本视频合成,Few-shot Video-to-Video Synthesis
专知会员服务
23+阅读 · 2019年12月15日
【新书】Python编程基础,669页pdf
专知会员服务
193+阅读 · 2019年10月10日
Hierarchically Structured Meta-learning
CreateAMind
25+阅读 · 2019年5月22日
已删除
将门创投
13+阅读 · 2019年4月17日
TCN v2 + 3Dconv 运动信息
CreateAMind
4+阅读 · 2019年1月8日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
PTGAN for Person Re-Identification
统计学习与视觉计算组
4+阅读 · 2018年9月10日
用Python编辑视频:MoviePy
Python程序员
3+阅读 · 2018年3月24日
【推荐】RNN/LSTM时序预测
机器学习研究会
25+阅读 · 2017年9月8日
【推荐】SVM实例教程
机器学习研究会
17+阅读 · 2017年8月26日
The Measure of Intelligence
Arxiv
6+阅读 · 2019年11月5日
VIP会员
相关资讯
Hierarchically Structured Meta-learning
CreateAMind
25+阅读 · 2019年5月22日
已删除
将门创投
13+阅读 · 2019年4月17日
TCN v2 + 3Dconv 运动信息
CreateAMind
4+阅读 · 2019年1月8日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
PTGAN for Person Re-Identification
统计学习与视觉计算组
4+阅读 · 2018年9月10日
用Python编辑视频:MoviePy
Python程序员
3+阅读 · 2018年3月24日
【推荐】RNN/LSTM时序预测
机器学习研究会
25+阅读 · 2017年9月8日
【推荐】SVM实例教程
机器学习研究会
17+阅读 · 2017年8月26日
Top
微信扫码咨询专知VIP会员