【KDD2020-清华大学】理解图表示学习中的负采样，Understanding Negative Sampling

2020 年 5 月 23 日 专知

图表示学习近年来得到了广泛的研究。尽管它在为各种网络生成连续嵌入方面具有潜力，但针对大量节点推断高质量表示的有效性和效率仍然具有挑战性。采样是实现性能目标的关键。现有技术通常集中于正节点对的抽样，而对负节点对的抽样策略却没有进行充分的探索。为了弥补这一差距，我们从目标和风险两个角度系统地分析了负抽样的作用，从理论上论证了负抽样与正抽样在确定优化目标和由此产生的方差方面同样重要。据我们所知，我们是第一个推导出负抽样分布应该与正抽样分布呈正相关但亚线性相关的理论并进行量化的工作。在该理论的指导下，我们提出了MCNS，用自对比近似逼近正分布，用Metropolis-Hastings加速负抽样。我们在5个数据集上评估了我们的方法，这些数据集涵盖了广泛的下游图数据学习任务，包括链接预测、节点分类和个性化推荐，总共有19个实验设置。这些较为全面的实验结果证明了其鲁棒性和优越性。

https://arxiv.org/abs/2005.09863

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“NSGRL” 可以获取《理解图表示学习中的负采样，Understanding Negative Sampling》专知下载链接索引

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

相关内容

负采样

关注 77

自然语言处理领域中，判断两个单词是不是一对上下文词（context）与目标词（target），如果是一对，则是正样本，如果不是一对，则是负样本。采样得到一个上下文词和一个目标词，生成一个正样本（positive example），生成一个负样本（negative example），则是用与正样本相同的上下文词，再在字典中随机选择一个单词，这就是负采样（negative sampling）。

【KDD2020】图神经网络生成式预训练，GPT-GNN: Generative Pre-Training of Graph Neural Networks

专知会员服务

99+阅读 · 2020年7月3日

【KDD2020-清华大学】图对比编码的图神经网络预训练

专知会员服务

46+阅读 · 2020年6月18日

【清华大学】图随机神经网络，Graph Random Neural Networks

专知会员服务

156+阅读 · 2020年5月26日

【KDD2020-清华大学】理解图表示学习中的负采样，Understanding Negative Sampling in Graph Representation Learning

专知会员服务

58+阅读 · 2020年5月21日