在回归任务中,当某些连续标签值的观测难以收集时,数据不平衡容易出现在带注释的数据中。当涉及到分子和聚合物属性预测时,带注释的图形数据集通常很小,因为标记它们需要昂贵的设备和努力。为解决图形回归任务中稀有标签值的示例不足的问题,我们提出了一个半监督框架,通过自我训练逐步平衡训练数据并减少模型偏差。训练数据的平衡是通过(1)使用新的回归置信度测量为代表性不足的标签给更多的图形贴上伪标签,和(2)在用伪标签平衡数据后,为剩余的稀有标签在潜在空间中增加图形示例来实现的。前者是为了从标签被自信地预测的未标记数据中识别出质量示例,并从不平衡的带注释的数据中按照反向分布抽取一部分。后者与前者协作,使用新的标签锚定混合算法,以达到完美的平衡。我们在图数据集上对七个回归任务进行了实验。结果表明,提出的框架显著减少了预测图属性的错误,特别是在代表性不足的标签区域。

成为VIP会员查看完整内容
23

相关内容

【KDD2023】任务等变图少样本学习
专知会员服务
16+阅读 · 2023年6月8日
【KDD2023】基于弱信息的强图神经网络学习
专知会员服务
37+阅读 · 2023年6月4日
CVPR 2022 Oral | 基于熵筛选的半监督三维旋转回归
专知会员服务
16+阅读 · 2022年4月18日
专知会员服务
24+阅读 · 2021年9月10日
专知会员服务
31+阅读 · 2021年7月2日
专知会员服务
32+阅读 · 2021年3月7日
【AAAI2021】小样本学习多标签意图检测
专知会员服务
54+阅读 · 2020年12月8日
近期必读的七篇 ECCV 2020【少样本学习(FSL)】相关论文
【KDD2022】自监督超图Transformer推荐系统
专知
1+阅读 · 2022年8月1日
CVPR 2019:精确目标检测的不确定边界框回归
AI科技评论
13+阅读 · 2019年9月16日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
3+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2023年7月9日
Learning from Few Samples: A Survey
Arxiv
77+阅读 · 2020年7月30日
Generative Adversarial Networks: A Survey and Taxonomy
VIP会员
相关VIP内容
【KDD2023】任务等变图少样本学习
专知会员服务
16+阅读 · 2023年6月8日
【KDD2023】基于弱信息的强图神经网络学习
专知会员服务
37+阅读 · 2023年6月4日
CVPR 2022 Oral | 基于熵筛选的半监督三维旋转回归
专知会员服务
16+阅读 · 2022年4月18日
专知会员服务
24+阅读 · 2021年9月10日
专知会员服务
31+阅读 · 2021年7月2日
专知会员服务
32+阅读 · 2021年3月7日
【AAAI2021】小样本学习多标签意图检测
专知会员服务
54+阅读 · 2020年12月8日
近期必读的七篇 ECCV 2020【少样本学习(FSL)】相关论文
相关基金
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
3+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员