讲座题目
网络中的不完全性:偏差、偏斜结果和一些解决方案:Incompleteness in Networks: Biases, Skewed Results, and Some Solutions
讲座简介
神经网络分析通常是在更大的完全观测网络的不完全样本上进行的(它们被认为代表了一些感兴趣的现象)。例如,许多研究人员从在线数据存储库(如snap.stanford.edu和icon.colorado.edu)获取网络,而不知道如何收集网络。这样的网络可能无法很好地表示完全观察到的现象。更完整的数据将导致更精确的分析,但数据获取最多可能代价高昂,最糟糕的情况下容易出错(例如,考虑一个故意破坏查询答案的对手)。过去关于这个主题的工作分为两个分支:(1)假设一个网络模型,并使用观察到的数据来推断未观察到的数据;(2)不假设一个网络模型,而是使用观察到的数据来学习给定查询预算的数据获取策略。我们关注第二个分支。也就是说,给定用于识别额外节点和边的查询预算,如何改进观测网络样本,使其更准确地表示完全观测的网络?这个问题与图形采样和爬行等主题相关,但与之不同。在本教程中,我们将讨论不完整网络中的潜在偏差,并提出通过主动探测节点和边来丰富此类网络的方法。我们将集中讨论多臂bandit、在线主动学习和这个问题的Markov决策过程公式(也称为网络发现问题);并澄清学习成长网络(也称为主动探索)和学习网络上的“最佳”功能(也称为主动学习)之间的区别。
讲座嘉宾
Timothy Sakharov,是蒂娜·埃利亚西·拉德教授的三年级博士生。他的研究重点是网络科学和计算机科学的交叉。他对机器学习和数据挖掘方法在网络中的应用感兴趣。目前,他正致力于通过智能节点查询来减轻网络的不完整性。蒂姆拥有东北大学信息科学学士学位 Forum)上发表了受邀的主题演讲(“人工智能与机器学习:Facebook视角”)。