摘要 在线社交网络中的消息流行度预测研究,对推荐、广告、检索等应用场景都具有非常重要的作用。近年来,深度学习的蓬勃发展和消息传播数据的积累,为基于深度学习的流行度预测研究提供了坚实的发展基础。现有的流行度预测研究综述,主要是围绕传统的流行度预测方法展开的,而基于深度学习的流行度预测方法目前仍未得到系统性地归纳和梳理,不利于流行度预测领域的持续发展。鉴于此,该文重点论述和分析现有的基于深度学习的流行度预测相关研究,对近年来基于深度学习的流行度预测研究进行了归纳梳理,将其分为基于深度表示和基于深度融合的流行度预测方法,并对该研究方向的发展现状和未来趋势进行了分析展望。
http://jcip.cipsc.org.cn/CN/abstract/abstract3082.shtml
随着互联网的繁荣发展,由用户原创内容(user generatedcontent,UGC)主导的各种社交网站也 随 之 在 互 联 网 中 兴 起,包 括 国 外 的 脸 书 (Facebook)、推 特 (Twitter)、照 片 墙 (Instagram), 以及国内的新浪微博、微信朋友圈等。在这些社交 网站 上,用 户 之 间 组 成 的 在 线 社 交 网 络 (online socialnetworks,OSN),为信息在网络空间的传播带来了前所未有的便利。每天有数千万的原创内容 在这些平台上被产生和传播[1]。如此纷杂巨量的信 息,不仅为平台的管理带来了巨大的挑战,也容易对 人们造成信息过载的困扰。在线社交网路中的消息 流行度预测研究,旨在提前从海量的信息中预测并 识别出未来的热门消息,从而为平台的质量把控提 供辅助,并帮助人们从信息过载的困境中解脱出来。但由于社交网络的开放性以及社交网络中级联传播 效应所带来的不确定性,准确地预测消息未来的流 行度是一项极具困难和挑战的任务。
传统的消 息 流 行 度 预 测 方 法 主 要 分 为 两 类, 分别是基 于 特 征 提 取 的 方 法[2-4]和 基 于 点 过 程 建 模的方 法[5-7]。前 者 通 常 会 人 工 提 取 内 容、用 户、 时序、结构等方面的特征,然后根据这些提取的特 征,结合传统 的 机 器 学 习 方 法 来 对 消 息 未 来 的 流 行度进行回归或分类预测。这类方法的性能依赖 于人工提取 特 征 的 质 量,而 这 些 人 工 特 征 通 常 又 是启发式提 取 的,很 难 全 面 且 有 效 地 捕 获 各 类 有 效预测因素。而后者,基于点过程建模的方法,将 消息传播过程看成是用户转发行为的一个到达点 过程。其核 心 在 于 根 据 特 定 的 假 设,对 点 过 程 的 速率函数 进 行 不 同 的 建 模。但 在 实 际 场 景 中,我 们很难知道 速 率 函 数 的 真 正 假 设 或 形 式,从 而 限 制了点过程模型的能力。
随着近年来深度学习在文本、语音、图像等领域 的成功应用,基于深度学习的流行度预测方法也开 始逐渐被研究者们关注并提出[1,8-9]。借助于深度 学习强大的表示能力,研究者们对内容、用户、时序、 结构等因素进行了有效的建模表示[1,8]。此外,通 过深度融 合 技 术,实 现 了 多 因 素 以 及 多 模 型 的 融 合[9],大 大 提 升 了 模 型 对 消 息 未 来 流 行 度 的 预 测 性能。
为了更好地帮助流行度预测领域的相关研究人 员,也有研究者梳理了消息流行度预测研究的相关 工作,并形成了综述[10-12]。但已有的这些综述,主 要都是围绕传统的流行度预测方法展开的,而未对 基于深度学习的流行度预测方法进行系统性地归纳 和梳理。因此,与已有综述不同,本文将重点论述和 分析基于深度学习的现有流行度预测研究,并梳理 出这些研究之间的相互关系。
本文组织结构如下:第1节介绍在线社交网络 中流行度预测研究的相关背景,第2节和第3节分 别梳理基于深度表示的流行度预测研究和基于深度 融合的流行度预测研究。第4节从评价数据集、评 价指标出发,总结了现有方法的评价体系。第5节 对全文进行了总结。
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“流行度预测” 就可以获取《基于深度学习的流行度预测研究综述》专知下载链接