我们如何找到半监督学习的正确图?在实际应用中,选择用于计算的边是任何图学习过程中的第一步。有趣的是,通常有许多类型的相似性可供选择作为节点之间的边,而边的选择会极大地影响下游半监督学习系统的性能。然而,尽管图设计很重要,但大多数文献都认为图是静态的。

在这项工作中,我们提出了Grale,一个可扩展的方法,我们已经开发以解决图设计问题的数十亿节点。Grale通过将(潜在的弱)相似度的不同度量方法融合在一起,创建一个节点间具有高度任务特异性同质性的图。Grale是为在大型数据集上运行而设计的。我们已经在谷歌的20多个不同的工业设置中部署了Grale,包括拥有数百亿节点的数据集,以及数以万亿计的潜在边界。通过使用对位置敏感的哈希技术,我们大大减少了需要评分的对的数量,允许我们学习特定任务的模型,并以小时为这些数据集构建相关的最近邻居图,而不是可能需要的天甚至周。

我们通过一个案例研究来说明这一点,在这个案例研究中,我们研究了Grale在YouTube上一个有上亿项的滥用分类问题上的应用。在这个应用程序中,我们发现Grale可以在硬编码规则和内容分类器上检测到大量的恶意参与者,相对于单独使用这些方法,Grale的召回总量增加了89%。

成为VIP会员查看完整内容
34

相关内容

专知会员服务
44+阅读 · 2020年9月3日
KDD2020 | 真实世界超图的结构模式和生成模型
专知会员服务
28+阅读 · 2020年8月18日
【KDD2020】自适应多通道图卷积神经网络
专知会员服务
119+阅读 · 2020年7月9日
【KDD2020-清华大学】图对比编码的图神经网络预训练
专知会员服务
44+阅读 · 2020年6月18日
【元图(Meta-Graph):元学习小样本连接预测】
专知会员服务
64+阅读 · 2020年5月31日
注意力图神经网络的多标签文本分类
专知会员服务
111+阅读 · 2020年3月28日
WWW 2020 开源论文 | 异构图Transformer
PaperWeekly
13+阅读 · 2020年4月3日
图神经网络火了?谈下它的普适性与局限性
机器之心
21+阅读 · 2019年7月29日
图嵌入(Graph embedding)综述
人工智能前沿讲习班
449+阅读 · 2019年4月30日
谷歌提出MorphNet:网络规模更小、速度更快!
全球人工智能
4+阅读 · 2019年4月20日
谷歌 MorphNet:让你的神经网络更小但更快
机器学习算法与Python学习
5+阅读 · 2019年4月18日
基于内容的小说文本分类
人工智能头条
7+阅读 · 2018年12月14日
Heterogeneous Graph Transformer
Arxiv
27+阅读 · 2020年3月3日
Arxiv
15+阅读 · 2020年2月5日
Arxiv
10+阅读 · 2019年2月19日
dynnode2vec: Scalable Dynamic Network Embedding
Arxiv
14+阅读 · 2018年12月6日
Arxiv
9+阅读 · 2018年10月18日
Arxiv
12+阅读 · 2018年1月28日
VIP会员
相关主题
相关VIP内容
专知会员服务
44+阅读 · 2020年9月3日
KDD2020 | 真实世界超图的结构模式和生成模型
专知会员服务
28+阅读 · 2020年8月18日
【KDD2020】自适应多通道图卷积神经网络
专知会员服务
119+阅读 · 2020年7月9日
【KDD2020-清华大学】图对比编码的图神经网络预训练
专知会员服务
44+阅读 · 2020年6月18日
【元图(Meta-Graph):元学习小样本连接预测】
专知会员服务
64+阅读 · 2020年5月31日
注意力图神经网络的多标签文本分类
专知会员服务
111+阅读 · 2020年3月28日
相关资讯
WWW 2020 开源论文 | 异构图Transformer
PaperWeekly
13+阅读 · 2020年4月3日
图神经网络火了?谈下它的普适性与局限性
机器之心
21+阅读 · 2019年7月29日
图嵌入(Graph embedding)综述
人工智能前沿讲习班
449+阅读 · 2019年4月30日
谷歌提出MorphNet:网络规模更小、速度更快!
全球人工智能
4+阅读 · 2019年4月20日
谷歌 MorphNet:让你的神经网络更小但更快
机器学习算法与Python学习
5+阅读 · 2019年4月18日
基于内容的小说文本分类
人工智能头条
7+阅读 · 2018年12月14日
相关论文
Heterogeneous Graph Transformer
Arxiv
27+阅读 · 2020年3月3日
Arxiv
15+阅读 · 2020年2月5日
Arxiv
10+阅读 · 2019年2月19日
dynnode2vec: Scalable Dynamic Network Embedding
Arxiv
14+阅读 · 2018年12月6日
Arxiv
9+阅读 · 2018年10月18日
Arxiv
12+阅读 · 2018年1月28日
微信扫码咨询专知VIP会员