论文题目:Croppable Knowledge Graph Embedding

本文作者:朱渝珊(浙江大学)、张文(浙江大学)、刘治强(浙江大学)、陈名杨(浙江大学)、梁磊(蚂蚁集团)、陈华钧(浙江大学)

发表会议:ACL 2025

论文链接:https://arxiv.org/abs/2407.02779

代码链接:https://github.com/YushanZhu/croppable-kge

欢迎转载,转载请注明出处****

一、引言

知识图谱嵌入(KGE)的维度与性能存在显著关联:高维KGE虽然表达能力更强,但需要更多存储和计算资源。实际应用中,不同设备对KGE维度的需求各异,如下图所示,服务器等高性能设备可部署高维KGE,而智能手机、车载系统等资源受限设备则需低维KGE。传统方法需要为每个目标维度单独训练模型,当需求变更时不得不重新训练,尤其在低维场景下,为了确保KGE的良好性能,还需借助知识蒸馏等模型压缩技术。这显著增加了训练成本,并限制了 KGE 在不同场景中服务的效率和灵活性。 针对这一瓶颈,本文提出了一个新概念 “可裁剪的知识图谱嵌入”,并关注以下研究问题:是否能够训练一种可裁剪的 KGE,从中可以裁剪出各种所需维度的 KGE,无需额外训练即可直接使用,并且裁剪出的 KGE 具有良好的性能?在训练过程中,这些子模型通过参数共享实现协同训练:低维子模型借助高维子模型增强表达能力,而高维子模型则保留了低维模型的基础知识。该方法使得用户可直接从完整模型中裁剪出任意目标维度的子模型,无需重新训练即可获得性能良好的即用型KGE,显著提升了模型服务的灵活性和效率。 二、方法

我们提出的可裁剪KGE框架MED包含个不同维度的子模型(),每个子模型对应维度是,其嵌入由完整嵌入的前维构成。对于给定三元组,知识图谱嵌入模型的评分函数记为,则子模型对三元组的评分为,其中表示向量的前维。子模型的参数会被更高维度的()共享。子模型数量及各子模型维度可根据实际需求设置。 在模型设计上,我们追求两个目标:(1)低维子模型需最大化性能,(2)高维子模型不仅要保持低维子模型的能力,还需学习低维模型无法掌握的知识(即正确预测那些被低维子模型预测错误的三元组)。MED基于知识蒸馏技术,通过以下机制实现:

  • 互学习机制(Mutual Learning Mechanism):高低维子模型相互学习,使低维模型性能提升,同时高维模型保留低维模型的基础能力;
  • 进化提升机制(Evolutionary Improvement Mechanism):帮助高维模型掌握低维模型难以学习的知识;
  • 动态损失加权(Dynamic Loss Weight):自适应平衡各子模型的多重优化目标。

三、实验

本文在4个标准知识图谱补全数据集(WN18RR, FB15K237, CoDEx-L, YAGO3-10)上测试了4种KGE模型,并基于大规模社交知识图谱(SKG)验证了3种实际应用场景,还将该方法拓展应用到BERT语言模型。实验结果表明,MED方法不仅具有显著效果和高效性,还展现出灵活的可扩展能力。

成为VIP会员查看完整内容
3

相关内容

ACL 2025 | 高效样本利用的大模型人类评估方法
专知会员服务
13+阅读 · 5月22日
NAACL 2025 | 知识增强下的智能体规划
专知会员服务
32+阅读 · 2月7日
AAAI 2025 | 基于模态分词的细粒度实体表示学习框架
专知会员服务
25+阅读 · 2024年12月26日
IJCAI 2024 | 持续多模态知识图谱构建
专知会员服务
31+阅读 · 2024年6月6日
COLING2024 | 面向编程的自然语言处理综述
专知会员服务
28+阅读 · 2024年4月23日
AAAI2024|基于预训练模型的知识图谱嵌入编辑
专知会员服务
32+阅读 · 2023年12月22日
EMNLP2023:Schema自适应的知识图谱构建
专知会员服务
43+阅读 · 2023年12月3日
AAAI2023|图对比学习的模型增强技巧
专知会员服务
36+阅读 · 2023年2月25日
【KDD 2020】基于互信息最大化的多知识图谱语义融合
专知会员服务
43+阅读 · 2020年9月7日
ICCV 2019 | 精确的端到端的弱监督目标检测网络
AI科技评论
11+阅读 · 2019年12月9日
赛尔原创 | EMNLP 2019 常识信息增强的事件表示学习
哈工大SCIR
28+阅读 · 2019年9月12日
ACL 2019 | 多语言BERT的语言表征探索
AI科技评论
21+阅读 · 2019年9月6日
KDD 2019论文解读:异构信息网络上的对抗生成学习
云栖社区
23+阅读 · 2019年8月21日
赛尔原创 | ACL 2019 检索增强的对抗式回复生成
哈工大SCIR
12+阅读 · 2019年7月4日
论文 | YOLO(You Only Look Once)目标检测
七月在线实验室
14+阅读 · 2017年12月12日
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
15+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Arxiv
170+阅读 · 2023年4月20日
Arxiv
13+阅读 · 2020年8月3日
Arxiv
11+阅读 · 2018年7月31日
VIP会员
相关VIP内容
ACL 2025 | 高效样本利用的大模型人类评估方法
专知会员服务
13+阅读 · 5月22日
NAACL 2025 | 知识增强下的智能体规划
专知会员服务
32+阅读 · 2月7日
AAAI 2025 | 基于模态分词的细粒度实体表示学习框架
专知会员服务
25+阅读 · 2024年12月26日
IJCAI 2024 | 持续多模态知识图谱构建
专知会员服务
31+阅读 · 2024年6月6日
COLING2024 | 面向编程的自然语言处理综述
专知会员服务
28+阅读 · 2024年4月23日
AAAI2024|基于预训练模型的知识图谱嵌入编辑
专知会员服务
32+阅读 · 2023年12月22日
EMNLP2023:Schema自适应的知识图谱构建
专知会员服务
43+阅读 · 2023年12月3日
AAAI2023|图对比学习的模型增强技巧
专知会员服务
36+阅读 · 2023年2月25日
【KDD 2020】基于互信息最大化的多知识图谱语义融合
专知会员服务
43+阅读 · 2020年9月7日
相关基金
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
15+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员