【NeurIPS2025】大型语言模型中关系解码线性算子的结构 - 专知VIP

会员服务 ·

0

NeurIPS 2025 · 大语言模型 · 关系解码 · 线性算子 ·

【NeurIPS2025】大型语言模型中关系解码线性算子的结构

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

本文研究了 Hernandez 等人（2023） 所提出的、能够在 Transformer 语言模型中解码特定关系事实（relational facts）的线性算子（linear operators）的结构特征。我们将其原本针对单一关系的研究扩展至多种关系的集合，并系统性地描绘了这些线性算子的组织结构。研究表明，这类关系解码算子集合可以通过简单的三阶张量网络（order-3 tensor networks）进行高度压缩，而几乎不损失解码精度。为解释这种出人意料的冗余性（redundancy），我们提出了一种交叉评估协议（cross-evaluation protocol）：将每个线性解码算子应用于其他关系的主语（subject），以考察它们的泛化与重叠性。实验结果显示，这些线性映射并非分别编码了彼此独立的关系，而是提取出反复出现的、较为粗粒度的语义属性（coarse-grained semantic properties）。例如，“首都所在国家（country of capital city）”与“食物所属国家（country of food）”都属于同一类更一般的“国家归属（country-of-X）”属性。这种以属性为中心（property-centric）的结构不仅解释了这些算子的可压缩性，也揭示了它们仅能泛化到语义上相近的新关系的原因。因此，我们的研究指出，在 Transformer 语言模型中，**线性关系解码机制主要基于属性（property-based）而非特定关系（relation-specific）**的结构原理。

成为VIP会员查看完整内容

1

相关内容

NeurIPS 2025

【NeurIPS2024】几何轨迹扩散模型

【NeurIPS2024】几何轨迹扩散模型

专知会员服务

24+阅读 · 2024年10月20日

【ICML2024】基于正则化的持续学习的统计理论

【ICML2024】基于正则化的持续学习的统计理论

专知会员服务

19+阅读 · 2024年6月11日

【NeurIPS2023】神经预测与对齐的谱理论

【NeurIPS2023】神经预测与对齐的谱理论

专知会员服务

18+阅读 · 2023年9月28日

【TPAMI2023】面向双任务对话语言理解的关系时序图推理

【TPAMI2023】面向双任务对话语言理解的关系时序图推理

专知会员服务

23+阅读 · 2023年7月5日

【ICML2022】知识图谱上逻辑查询的神经符号模型

【ICML2022】知识图谱上逻辑查询的神经符号模型

专知会员服务

28+阅读 · 2022年5月25日

【NeurIPS2021】模型可解释性的符号语言基础

专知会员服务

22+阅读 · 2021年10月8日

【ICML2021】数据表示的几何评估

专知会员服务

38+阅读 · 2021年6月3日

【WSDM2021】基于演化状态图的时间序列事件预测

【WSDM2021】基于演化状态图的时间序列事件预测

专知会员服务

54+阅读 · 2020年12月1日

【NeurIPS2020】可处理的反事实推理的深度结构因果模型

【NeurIPS2020】可处理的反事实推理的深度结构因果模型

专知会员服务

49+阅读 · 2020年9月28日

【ACMMM2020】零样本语义分割的上下文感知特征生成

【ACMMM2020】零样本语义分割的上下文感知特征生成

专知会员服务

16+阅读 · 2020年8月21日

AAAI 2022 | ProtGNN：自解释图神经网络

AAAI 2022 | ProtGNN：自解释图神经网络

专知

10+阅读 · 2022年2月28日

【ICML2021】因果匹配领域泛化

【ICML2021】因果匹配领域泛化

专知

12+阅读 · 2021年8月12日

【CVPR2021】CausalVAE: 引入因果结构的解耦表示学习

【CVPR2021】CausalVAE: 引入因果结构的解耦表示学习

专知

19+阅读 · 2021年3月28日

【CVPR2021】跨模态检索的概率嵌入

【CVPR2021】跨模态检索的概率嵌入

专知

17+阅读 · 2021年3月2日

【CVPR 2020 Oral】小样本类增量学习

【CVPR 2020 Oral】小样本类增量学习

专知

20+阅读 · 2020年6月26日

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

专知

13+阅读 · 2020年4月1日

【NeurIPS2019】图变换网络：Graph Transformer Network

【NeurIPS2019】图变换网络：Graph Transformer Network

专知

245+阅读 · 2019年11月18日

【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络（DCRNN）

【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络（DCRNN）

专知

44+阅读 · 2019年10月28日

【论文笔记】用于Web级推荐系统的图卷积神经网络

【论文笔记】用于Web级推荐系统的图卷积神经网络

专知

20+阅读 · 2019年9月30日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

伽罗华环上指数和及其在编码理论中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

半参数空间自回归模型的理论研究及应用

国家自然科学基金

0+阅读 · 2015年12月31日

融合系分类问题及其特征幂等元研究

国家自然科学基金

1+阅读 · 2015年12月31日

有限域上的代数曲线在纠错码构造中的几点应用

国家自然科学基金

0+阅读 · 2015年12月31日

量子齐次空间上同调的非交换Hodge分解及形变意义

国家自然科学基金

0+阅读 · 2015年12月31日

复合材料里电磁问题的有限元方法

国家自然科学基金

1+阅读 · 2015年12月31日

光滑函数类的熵数估计

国家自然科学基金

0+阅读 · 2015年12月31日

关于流体力学边界层中的一些问题

国家自然科学基金

0+阅读 · 2014年12月31日

相依重尾随机变量和的渐近性及其在更新风险模型中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

解析函数空间上的Toeplitz型奇异积分算子

国家自然科学基金

0+阅读 · 2014年12月31日

A theoretical comparison of weight constraints in forecast combination and model averaging

Arxiv

0+阅读 · 10月30日

Robust variable selection for spatial point processes observed with noise

Arxiv

0+阅读 · 10月29日

Optimal morphings for model-order reduction for poorly reducible problems with geometric variability

Arxiv

0+阅读 · 10月29日

Amortized variational transdimensional inference

Arxiv

0+阅读 · 10月28日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

105+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

219+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

84+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

487+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

151+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

80+阅读 · 2023年3月26日

VIP会员

相关主题

大语言模型

相关VIP内容

【NeurIPS2024】几何轨迹扩散模型

【NeurIPS2024】几何轨迹扩散模型

专知会员服务

24+阅读 · 2024年10月20日

【ICML2024】基于正则化的持续学习的统计理论

【ICML2024】基于正则化的持续学习的统计理论

专知会员服务

19+阅读 · 2024年6月11日

【NeurIPS2023】神经预测与对齐的谱理论

【NeurIPS2023】神经预测与对齐的谱理论

专知会员服务

18+阅读 · 2023年9月28日

【TPAMI2023】面向双任务对话语言理解的关系时序图推理

【TPAMI2023】面向双任务对话语言理解的关系时序图推理

专知会员服务

23+阅读 · 2023年7月5日

【ICML2022】知识图谱上逻辑查询的神经符号模型

【ICML2022】知识图谱上逻辑查询的神经符号模型

专知会员服务

28+阅读 · 2022年5月25日

【NeurIPS2021】模型可解释性的符号语言基础

专知会员服务

22+阅读 · 2021年10月8日

【ICML2021】数据表示的几何评估

专知会员服务

38+阅读 · 2021年6月3日

【WSDM2021】基于演化状态图的时间序列事件预测

【WSDM2021】基于演化状态图的时间序列事件预测

专知会员服务

54+阅读 · 2020年12月1日

【NeurIPS2020】可处理的反事实推理的深度结构因果模型

【NeurIPS2020】可处理的反事实推理的深度结构因果模型

专知会员服务

49+阅读 · 2020年9月28日

【ACMMM2020】零样本语义分割的上下文感知特征生成

【ACMMM2020】零样本语义分割的上下文感知特征生成

专知会员服务

16+阅读 · 2020年8月21日

热门VIP内容

开通专知VIP会员享更多权益服务

《太空边缘（临近空间）的武器化？军事高空平台的进展与前景》

《利用星基增强系统（SBAS）信号进行射频干扰（RFI）检测与特征分析》

美陆军在“艾布拉姆斯”坦克与“布拉德利”步战车上测试“牛蛙”反无人机炮塔

《军事领域特性及其对军事人工智能应用的影响》

相关资讯

AAAI 2022 | ProtGNN：自解释图神经网络

AAAI 2022 | ProtGNN：自解释图神经网络

专知

10+阅读 · 2022年2月28日

【ICML2021】因果匹配领域泛化

【ICML2021】因果匹配领域泛化

专知

12+阅读 · 2021年8月12日

【CVPR2021】CausalVAE: 引入因果结构的解耦表示学习

【CVPR2021】CausalVAE: 引入因果结构的解耦表示学习

专知

19+阅读 · 2021年3月28日

【CVPR2021】跨模态检索的概率嵌入

【CVPR2021】跨模态检索的概率嵌入

专知

17+阅读 · 2021年3月2日

【CVPR 2020 Oral】小样本类增量学习

【CVPR 2020 Oral】小样本类增量学习

专知

20+阅读 · 2020年6月26日

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

专知

13+阅读 · 2020年4月1日

【NeurIPS2019】图变换网络：Graph Transformer Network

【NeurIPS2019】图变换网络：Graph Transformer Network

专知

245+阅读 · 2019年11月18日

【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络（DCRNN）

【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络（DCRNN）

专知

44+阅读 · 2019年10月28日

【论文笔记】用于Web级推荐系统的图卷积神经网络

【论文笔记】用于Web级推荐系统的图卷积神经网络

专知

20+阅读 · 2019年9月30日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

相关基金

伽罗华环上指数和及其在编码理论中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

半参数空间自回归模型的理论研究及应用

国家自然科学基金

0+阅读 · 2015年12月31日

融合系分类问题及其特征幂等元研究

国家自然科学基金

1+阅读 · 2015年12月31日

有限域上的代数曲线在纠错码构造中的几点应用

国家自然科学基金

0+阅读 · 2015年12月31日

量子齐次空间上同调的非交换Hodge分解及形变意义

国家自然科学基金

0+阅读 · 2015年12月31日

复合材料里电磁问题的有限元方法

国家自然科学基金

1+阅读 · 2015年12月31日

光滑函数类的熵数估计

国家自然科学基金

0+阅读 · 2015年12月31日

关于流体力学边界层中的一些问题

国家自然科学基金

0+阅读 · 2014年12月31日

相依重尾随机变量和的渐近性及其在更新风险模型中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

解析函数空间上的Toeplitz型奇异积分算子

国家自然科学基金

0+阅读 · 2014年12月31日

相关论文

A theoretical comparison of weight constraints in forecast combination and model averaging

Arxiv

0+阅读 · 10月30日

Robust variable selection for spatial point processes observed with noise

Arxiv

0+阅读 · 10月29日

Optimal morphings for model-order reduction for poorly reducible problems with geometric variability

Arxiv

0+阅读 · 10月29日

Amortized variational transdimensional inference

Arxiv

0+阅读 · 10月28日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

105+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

219+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

84+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

487+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

151+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

80+阅读 · 2023年3月26日

微信扫码咨询专知VIP会员