最佳长论文奖
对YouTube上错误信息过滤泡沫的审计:泡沫破裂和最近的行为变化
错误信息过滤气泡在自适应系统中的负面影响已经为研究人员所知有一段时间了。几项研究调查了用户仅仅从提供的商品中选择“错误选项”进入错误信息过滤泡沫的速度,其中最显著的是YouTube上的研究。然而,到目前为止,还没有研究调查“泡沫破裂”需要什么,也就是说,恢复泡沫外壳。我们提出了一项研究,在这项研究中,预编程的代理(扮演YouTube用户)通过观看虚假信息推广内容(针对各种主题)深入到虚假信息过滤气泡中。然后,通过观察虚假信息揭穿内容,代理试图打破泡沫,达到更平衡的推荐组合。我们记录了特工们遇到的搜索结果和建议,并分析了它们是否存在错误信息。我们的关键发现是,过滤气泡的破裂是可能的,尽管不同的主题表现不同。此外,我们观察到过滤气泡在某些情况下并没有真正出现。我们还与之前的研究进行了直接比较。遗憾的是,尽管YouTube最近做出了承诺,但我们并未发现错误信息的出现有多大改善。
https://dl.acm.org/doi/10.1145/3460231.3474241
最佳学生论文
从用户互动中老虎机学习的方法通常需要一个特定上下文-动作组合将产生的奖励模型——例如,点击推荐的概率。这种常见的机器学习任务非常重要,因为上下文和动作的数据生成过程往往受到推荐系统本身的扭曲。事实上,当在数据收集时间部署的推荐策略不是均匀随机地选择其行动时,就会导致选择偏差,从而阻碍有效的奖励模型。这反过来又使离线策略学习——行业中的典型设置——变得特别具有挑战性。在这项工作中,我们提出并验证了一般的悲观奖励模型方法的离线策略学习的推荐。贝叶斯不确定性估计允许我们对自己的奖励模型表示怀疑,而这反过来又可以用来生成保守的决策规则。我们展示了它是如何缓解众所周知的决策现象,即所谓的优化者的诅咒,并将其与现有的悲观策略学习工作进行比较。当脊回归器对奖励进行建模时,利用后验均值和方差的可用封闭形式表达式,我们展示了如何有效地将悲观主义应用到离线策略推荐用例中。在广泛的环境中进行的经验观察表明,在决策过程中保持保守可以显著地提高推荐性能。我们方法的优点在现实环境中表现得最为明显,即有限的日志随机性、有限的训练样本和更大的行动空间。
https://dl.acm.org/doi/10.1145/3460231.3474247
最佳Demo
我们提出了Grapevine,一个用户控制的推荐,使本科生和研究生找到一个合适的研究建议。该系统通过使用最先进的知识提取、基于grape的推荐和智能用户界面,结合了探索性搜索、用户建模和推荐系统等领域的思想。在本文中,我们演示了系统的关键组件以及它们如何作为一个整体工作。