本文研究了 Hernandez 等人(2023) 所提出的、能够在 Transformer 语言模型中解码特定关系事实(relational facts)线性算子(linear operators)的结构特征。我们将其原本针对单一关系的研究扩展至多种关系的集合,并系统性地描绘了这些线性算子的组织结构。 研究表明,这类关系解码算子集合可以通过简单的三阶张量网络(order-3 tensor networks)进行高度压缩,而几乎不损失解码精度。为解释这种出人意料的冗余性(redundancy),我们提出了一种交叉评估协议(cross-evaluation protocol):将每个线性解码算子应用于其他关系的主语(subject),以考察它们的泛化与重叠性。 实验结果显示,这些线性映射并非分别编码了彼此独立的关系,而是提取出反复出现的、较为粗粒度的语义属性(coarse-grained semantic properties)。例如,“首都所在国家(country of capital city)”与“食物所属国家(country of food)”都属于同一类更一般的“国家归属(country-of-X)”属性。 这种以属性为中心(property-centric)的结构不仅解释了这些算子的可压缩性,也揭示了它们仅能泛化到语义上相近的新关系的原因。因此,我们的研究指出,在 Transformer 语言模型中,**线性关系解码机制主要基于属性(property-based)而非特定关系(relation-specific)**的结构原理。

成为VIP会员查看完整内容
1

相关内容

【NeurIPS2024】几何轨迹扩散模型
专知会员服务
24+阅读 · 2024年10月20日
【ICML2024】基于正则化的持续学习的统计理论
专知会员服务
19+阅读 · 2024年6月11日
【NeurIPS2023】神经预测与对齐的谱理论
专知会员服务
18+阅读 · 2023年9月28日
【TPAMI2023】面向双任务对话语言理解的关系时序图推理
专知会员服务
23+阅读 · 2023年7月5日
【ICML2022】知识图谱上逻辑查询的神经符号模型
专知会员服务
28+阅读 · 2022年5月25日
专知会员服务
22+阅读 · 2021年10月8日
专知会员服务
38+阅读 · 2021年6月3日
【WSDM2021】基于演化状态图的时间序列事件预测
专知会员服务
54+阅读 · 2020年12月1日
【NeurIPS2020】可处理的反事实推理的深度结构因果模型
专知会员服务
49+阅读 · 2020年9月28日
【ACMMM2020】零样本语义分割的上下文感知特征生成
专知会员服务
16+阅读 · 2020年8月21日
AAAI 2022 | ProtGNN:自解释图神经网络
专知
10+阅读 · 2022年2月28日
【ICML2021】因果匹配领域泛化
专知
12+阅读 · 2021年8月12日
【CVPR2021】跨模态检索的概率嵌入
专知
17+阅读 · 2021年3月2日
【CVPR 2020 Oral】小样本类增量学习
专知
20+阅读 · 2020年6月26日
【NeurIPS2019】图变换网络:Graph Transformer Network
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
A Survey of Large Language Models
Arxiv
487+阅读 · 2023年3月31日
Arxiv
80+阅读 · 2023年3月26日
VIP会员
相关VIP内容
【NeurIPS2024】几何轨迹扩散模型
专知会员服务
24+阅读 · 2024年10月20日
【ICML2024】基于正则化的持续学习的统计理论
专知会员服务
19+阅读 · 2024年6月11日
【NeurIPS2023】神经预测与对齐的谱理论
专知会员服务
18+阅读 · 2023年9月28日
【TPAMI2023】面向双任务对话语言理解的关系时序图推理
专知会员服务
23+阅读 · 2023年7月5日
【ICML2022】知识图谱上逻辑查询的神经符号模型
专知会员服务
28+阅读 · 2022年5月25日
专知会员服务
22+阅读 · 2021年10月8日
专知会员服务
38+阅读 · 2021年6月3日
【WSDM2021】基于演化状态图的时间序列事件预测
专知会员服务
54+阅读 · 2020年12月1日
【NeurIPS2020】可处理的反事实推理的深度结构因果模型
专知会员服务
49+阅读 · 2020年9月28日
【ACMMM2020】零样本语义分割的上下文感知特征生成
专知会员服务
16+阅读 · 2020年8月21日
相关资讯
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员