网络“垃圾”太烦？两大AI算法护你购物无忧

2020 年 8 月 21 日 AI科技评论

作者 | 陈彩娴

编辑 | 陈大鑫

在复杂多变的网络环境中，如何优化消费者的线上购物体验，是所有电商从业者的焦点之一。想象一下：如果用户浏览手机或网页时，时间有限，但垃圾信息与虚假资讯铺天盖地、障人眼目，用户的心情是轻松、愉快，或不耐烦、暴躁？

“智能推荐”或“个性化推荐”在线上购物、广告浏览与资讯传播等场景中的应用越来越广泛。基于用户的点击、点赞、评论、收藏、转发等等浏览行为进行建模，是算法推荐的常见操作。然而，推荐系统也会因为缺少用户的使用数据（如用户第一次登录某网页）面临尴尬的“冷启动”问题。

消费者在线上购物时，因为无法近距离触摸与体验商品，所以在下单前，他们往往会参照其他用户对商品的评价。但是，网络评价中经常夹杂着各种各样的水军评论与垃圾评论，对商品进行虚假描述，让消费者难辨真假。水军的套路千变万化，一时一个样，确实很难摸透。但是，目前很多探测系统都致力于提升探测垃圾评论的准确率，而忽略了产生实际影响的高级水军。

因此，智能推荐与垃圾消息过滤成为当今网络应用的主要研究热点之一。8月26日、27日连续两天，我们有幸邀请到两位KDD论文作者，分别是来自腾讯微信搜索应用部的陆元福同学和来自伊利诺伊大学芝加哥分校的在读博士生窦英通同学，为大家带来直播分享。

陆元福同学提出MetaHIN模型，将元学习与异质信息网络相结合，在数据与模型方面双管齐下，改善冷启动推荐系统。在数据层面，MetaHIN将推荐场景构建为异质信息网络(heterogeneous information network, HIN)，通过高阶图结构建模丰富的语义信息。在模型层面，MetaHIN结合近年较火的元学习（meta-learning），能够快速适应标记数据稀疏、缺少新用户与新产品的交互数据而衍生的新任务，从模型上缓解了冷启动推荐问题。研究表明，MetaHIN模型在许多基准测试中有出色的表现。

针对网络评论中的水军现象，窦英通同学应用极大极小博弈（minimax game）算法来解决这个问题。在这个算法的设计中，水军与水军探测器相互博弈。博弈分为两个非独立的马尔科夫决策过程（Markov Decision Processes），作者运用强化学习中的多臂赌博机（multi-armed bandit）和策略梯度（policy gradient）方法进行建模和优化。实验结果显示，文中提出的算法能有效检测危害较大的水军并降低平台的损失。

直播一：用于冷启动推荐的异质信息网络元学习方法

直播时间：8月26日（周三晚）20:00整

分享嘉宾：陆元福

嘉宾简介：北京邮电大学计算机学院硕士，腾讯在职，主要从事算法研究，曾以第一（学生）作者身份在IEEE TKDE、KDD等权威期刊会议上发表多篇学术论文，并入选腾讯2019犀牛鸟精英人才培养计划。

论文名称：《Meta-learning on Heterogeneous Information Networks for Cold-start Recommendation》

论文链接：https://aminer.cn/pub/5f03f3b611dc830562232019?conf=kdd2020

开源代码：https://github.com/rootlu/MetaHIN

分享背景：推荐系统旨在预测用户对物品的偏好，从而向用户提供其感兴趣的商品，为用户解决信息过载问题。为了缓解推荐系统中异质信息网络的“冷启动”问题，我们提出MetaHIN模型。MetaHIN在模型层面探索了元学习的能力，同时在数据层面研究了异质信息网络的表达能力。在MetaHIN中，我们提出使用多方面的语义上下文来增强每个用户的任务，因此设计了一种新颖的语义增强型任务构建器，用于在元学习场景中捕获异质信息网络中的语义信息。进一步地，我们构建了一个协同适应元学习器。该学习器既具有语义层面的适应性，又具有任务层面的适应性。

直播二：欺诈检测研究现状以及欺诈者对抗行为建模

直播时间：8月27日（周四晚）20:00整

分享嘉宾：窦英通

嘉宾简介：伊利诺伊大学芝加哥分校在读博士生（四年级），研究方向为图数据挖掘，欺诈检测与机器学习安全。

论文名称：《Robust Spammer Detection by Nash Reinforcement Learninmg》

论文地址：https://aminer.cn/pub/5f06ae449e795eee175e15ae?conf=kdd2020

开源代码：https://github.com/YingtongDou/Nash-Detect

分享背景：羊毛党、水军等各种灰黑产在社交网络和互联网金融中十分常见。本次分享将主要介绍欺诈检测问题在学术界的研究现状，以及如何将图神经网络和强化学习应用到欺诈检测问题中。

分享提纲：

1、欺诈检测问题背景及案例

2、欺诈检测研究路径及现状

3、KDD20：利用博弈论和强化学习建模欺诈者的对抗行为

4、SIGIR20&CIKM20：利用图神经网络检测伪装的欺诈者

5、欺诈检测相关资源推荐

如何加入？

扫码关注[ AI研习社顶会小助手] 微信号，发送关键字“KDD 2020+直播”，即可进群观看直播和获取课程资料。

阅读原文，直达“ KDD”小组，了解更多会议信息！

登录查看更多

相关内容

异质信息网络

关注 13

异质信息网络是一种信息网络，包含了节点和边，并且该节点和边具有一种或多种类型，异质信息网络包含了更更丰富的语义信息。

信息网络被定义为一个有向网络图G=(V,E)，其中，V是所有实体结点的集合，E是所有关系边的集合。并且存在着一个结点类型的映射函数φ:V→A和一个边类型的映射函数Ψ:E→R，对于每个对象v∈V属于一种特殊的对象类型φ(v)∈A，每个链接e∈E属于一种特殊的关系类型Ψ(e)∈R，那么这种网络类型就是信息网络。当对象类型的种类|A|>1或者关系类型的种类|R|>1时，这种信息网络是异质信息网络，否则，它是一种同质信息网络

【KDD2020】基于纳什强化学习的鲁棒垃圾邮件发送者检测

专知会员服务

17+阅读 · 2020年8月16日

【KDD2020-阿里】可调控的多兴趣推荐框架

专知会员服务

29+阅读 · 2020年8月11日

【基于元学习的推荐系统】5篇相关论文

专知会员服务

88+阅读 · 2020年1月20日

【元学习 | 论文】元学习与动态记忆为基础的原型网络的小样本突发事件检测，浙江大学，阿里巴巴

专知会员服务

57+阅读 · 2019年11月21日