使用点反馈与标准离线黑箱算法的在线影响力最大化问题
Online Influence Maximization with Node-level Feedback Using Standard Offline Oracles
论文摘要:本文研究在线影响力最大化问题:玩家与未知社交网络进行多轮交互,每轮需要选取种子集合投放信息,观察信息传播过程的反馈数据,据此学习网络参数并更新选取策略,最终最小化多轮交互的累积悔值。本文针对独立级联(IC)和线性阈值(LT)传播模型,各自设计了一个基于点反馈并且使用标准离线黑箱算法的最优悔值在线算法,改进了之前IC模型下基于边反馈的算法和LT模型下使用非标准黑箱的算法。本文提出变种极大似然估计方法,并定义伪似然函数,以辅助参数估计。本文的分析能够针对每个网络参数得到一个置信区间。
论文开创性突破与核心贡献:本文是第一篇应用点反馈和标准离线黑箱算法来解决 OIM 的文章,所提出的 bandit 算法具有理论合理性。同时,本文提出的使用 MLE 适应 GLB 的方法有潜力用于处理更广泛类别的分布所产生的奖励。
https://www.zhuanzhi.ai/paper/dd062c91adc97b354cd31c2354a7d559