论文标题:
GraphENS: Neighbor-Aware Ego Network Synthesis for Class-Imbalanced Node Classification
https://openreview.net/forum?id=MXEl7i-iru
这是一篇针对类别不平衡问题的数据生成文章。
在不平衡分类任务中,由于 GNN 中的消息传递,相比于过拟合少类节点而言,GNN 会对少类节点的邻居过拟合更加严重(本文的新观点)。
展示并说明了 GNN 会对少类节点的邻居出现严重的过拟合,这种现象称为 neighbor memorization。少类节点越少,这种现象就越严重。
本节作者展示了 Neighbor Memorization,通过实验说明了 GNN 对邻居的过拟合要比对少类节点本身的过拟合更严重。
1.1 Overfitting to minor classes
作者首先研究了对少类节点本身的过拟合问题,在数据集 PubMed 上构造了不平衡率为 100 的数据(多类/少类 = 100),采用两层 256-dim 的 GraphSAGE 训练了 2000 个 epoch,得到了以下结果:
实线是少类样本的 Acc,虚线是整体的 Acc。对比 Train 和 Test 可以看出,现有针对不平衡的方法对少样本有严重的过拟合问题,而 GraphENS 对此有缓解。
下一节作者将验证这到底是因为 GNN 对少类节点本身的特征过拟合,还是对其邻居结点过拟合。
作者在此采用了两组置换实验对比验证。
1.2.1 Node replacing experiment
这个实验相当于把不同的特征换到相同的邻居环境下,看看在邻居结构不变的情况下,改变中心节点的特征对分类效果的影响。
1.2.2 Node replacing experiment
随后,根据两个节点的 KL 散度衡量两个 ego network 的相似度:
邻居节点的采样数量由图中节点度数的分布决定(比如统计均值),以保证节点度数的稳定。
Node mixup
Whole Algorithm
更多阅读
#投 稿 通 道#
让你的文字被更多人看到
如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。
总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。
PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析、科研心得或竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。
📝 稿件基本要求:
• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注
• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题
• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算
📬 投稿通道:
• 投稿邮箱:hr@paperweekly.site
• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者
• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿
△长按添加PaperWeekly小编