【AAAI2024】Wikiformer: 利用维基百科结构化信息进行预训练，用于Ad-hoc检索 - 专知VIP

会员服务 ·

9

AAAI 2024 · Wikiformer · 维基百科 · 预训练 ·

2023 年 12 月 26 日

【AAAI2024】Wikiformer: 利用维基百科结构化信息进行预训练，用于Ad-hoc检索

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

随着深度学习和自然语言处理技术的发展，预训练语言模型已广泛用于解决信息检索（IR）问题。得益于预训练和微调的范式，这些模型实现了最先进的性能。在以前的工作中，维基百科中的纯文本在预训练阶段被广泛使用。然而，维基百科中的丰富结构化信息，如标题、摘要、层次化标题（多级标题）结构、文章之间的关系、参考文献、超链接结构和写作组织，并未被充分探索。在本文中，我们根据维基百科的结构化知识，设计了四个针对IR任务的预训练目标。与现有的预训练方法相比，我们的方法通过利用维基百科中由人类编辑的结构化数据，可以更好地捕获训练语料库中的语义知识。在多个IR基准数据集上的实验结果显示，与现有强大的检索基线相比，我们的模型在零样本和微调设置中均表现出色。此外，在生物医学和法律领域的实验结果表明，与以前的模型相比，我们的方法在垂直领域中实现了更好的性能，尤其是在需要长文本相似性匹配的场景中。代码可在 https://github.com/oneal2000/Wikiformer 获取。

成为VIP会员查看完整内容

19

相关内容

AAAI 2024

【WSDM2024】DiffKG:面向推荐的知识图谱扩散模型

【WSDM2024】DiffKG:面向推荐的知识图谱扩散模型

专知会员服务

28+阅读 · 2024年1月17日

【AAAI2024】LAMM: 多模态提示学习的标签对齐

【AAAI2024】LAMM: 多模态提示学习的标签对齐

专知会员服务

41+阅读 · 2023年12月14日

【NeurIPS2023】PAXION：在视频-语言基础模型中修补动作知识

【NeurIPS2023】PAXION：在视频-语言基础模型中修补动作知识

专知会员服务

18+阅读 · 2023年9月24日

【CVPR2023】I2MVFormer:大语言模型生成的多视图文档监督零样本图像分类

【CVPR2023】I2MVFormer:大语言模型生成的多视图文档监督零样本图像分类

专知会员服务

21+阅读 · 2023年3月1日

【ICML2021】具有超参数重要性的可解释的自动图表示学习

专知会员服务

26+阅读 · 2021年7月18日

【KDD2021】基于知识图谱的神经回答逻辑查询

专知会员服务

44+阅读 · 2021年7月6日

【NAACL2021】Graph4NLP：图深度学习自然语言处理，附239页ppt

【NAACL2021】Graph4NLP：图深度学习自然语言处理，附239页ppt

专知会员服务

106+阅读 · 2021年6月12日

【NAACL2021】长序列自然语言处理, 250页ppt

【NAACL2021】长序列自然语言处理, 250页ppt

专知会员服务

62+阅读 · 2021年6月7日

【AAAI2021】缓解语言模型政治偏见

专知会员服务

22+阅读 · 2021年2月6日

【AAAI2020】基于属性指导和纯视觉的注意力对齐的小样本识别

【AAAI2020】基于属性指导和纯视觉的注意力对齐的小样本识别

专知会员服务

15+阅读 · 2021年1月14日

【CVPR2023】Vita-CLIP:通过多模态提示的视频和文本自适应CLIP

【CVPR2023】Vita-CLIP:通过多模态提示的视频和文本自适应CLIP

专知

5+阅读 · 2023年4月11日

【CVPR2023】基于图像特定提示学习的零样本生成模型自适应

【CVPR2023】基于图像特定提示学习的零样本生成模型自适应

专知

5+阅读 · 2023年4月8日

【CVPR2023】自异构融合知识挖掘的长尾视觉识别

【CVPR2023】自异构融合知识挖掘的长尾视觉识别

专知

5+阅读 · 2023年4月6日

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

专知

29+阅读 · 2021年1月25日

深度学习图像检索(CBIR): 十年之大综述

深度学习图像检索(CBIR): 十年之大综述

专知

66+阅读 · 2020年12月5日

基于深度神经网络的关键词提取，Keywords extraction with DNN

基于深度神经网络的关键词提取，Keywords extraction with DNN

专知

10+阅读 · 2020年5月7日

【ICLR2020-Facebook AI】张量分解的时序知识图谱补全

【ICLR2020-Facebook AI】张量分解的时序知识图谱补全

专知

10+阅读 · 2020年4月14日

高效的文本生成方法 — LaserTagger 现已开源

高效的文本生成方法 — LaserTagger 现已开源

TensorFlow

30+阅读 · 2020年2月27日

【语义分割】一文概览主要语义分割网络：FCN,SegNet,U-Net...

【语义分割】一文概览主要语义分割网络：FCN,SegNet,U-Net...

产业智能官

18+阅读 · 2018年7月26日

Facebook开源MUSE：多语言无监督和监督词向量库

Facebook开源MUSE：多语言无监督和监督词向量库

论智

20+阅读 · 2017年12月23日

语义Web知识库补全关键技术研究

国家自然科学基金

14+阅读 · 2017年12月31日

基于DASH的交互式三维视频系统建模

国家自然科学基金

1+阅读 · 2015年12月31日

面向知识库的实体链接技术研究

国家自然科学基金

13+阅读 · 2015年12月31日

不确定知识图谱中面向结构查询的众包清洗研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向甲骨学知识图谱的实体发现及语义关系挖掘研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于Spark的大图数据最优子模式匹配查询方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于神经网络的跨语言实体链指研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

高维复杂结构数据降维

国家自然科学基金

10+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

Modelling multivariate extremes through angular-radial decomposition of the density function

Arxiv

0+阅读 · 2024年2月12日

Quantitative knowledge retrieval from large language models

Arxiv

0+阅读 · 2024年2月12日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

476+阅读 · 2023年3月31日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

173+阅读 · 2023年3月24日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

VIP会员

相关主题

相关VIP内容

【WSDM2024】DiffKG:面向推荐的知识图谱扩散模型

【WSDM2024】DiffKG:面向推荐的知识图谱扩散模型

专知会员服务

28+阅读 · 2024年1月17日

【AAAI2024】LAMM: 多模态提示学习的标签对齐

【AAAI2024】LAMM: 多模态提示学习的标签对齐

专知会员服务

41+阅读 · 2023年12月14日

【NeurIPS2023】PAXION：在视频-语言基础模型中修补动作知识

【NeurIPS2023】PAXION：在视频-语言基础模型中修补动作知识

专知会员服务

18+阅读 · 2023年9月24日

【CVPR2023】I2MVFormer:大语言模型生成的多视图文档监督零样本图像分类

【CVPR2023】I2MVFormer:大语言模型生成的多视图文档监督零样本图像分类

专知会员服务

21+阅读 · 2023年3月1日

【ICML2021】具有超参数重要性的可解释的自动图表示学习

专知会员服务

26+阅读 · 2021年7月18日

【KDD2021】基于知识图谱的神经回答逻辑查询

专知会员服务

44+阅读 · 2021年7月6日

【NAACL2021】Graph4NLP：图深度学习自然语言处理，附239页ppt

【NAACL2021】Graph4NLP：图深度学习自然语言处理，附239页ppt

专知会员服务

106+阅读 · 2021年6月12日

【NAACL2021】长序列自然语言处理, 250页ppt

【NAACL2021】长序列自然语言处理, 250页ppt

专知会员服务

62+阅读 · 2021年6月7日

【AAAI2021】缓解语言模型政治偏见

专知会员服务

22+阅读 · 2021年2月6日

【AAAI2020】基于属性指导和纯视觉的注意力对齐的小样本识别

【AAAI2020】基于属性指导和纯视觉的注意力对齐的小样本识别

专知会员服务

15+阅读 · 2021年1月14日

热门VIP内容

开通专知VIP会员享更多权益服务

【新书】面向企业的图学习扩展：生产级图学习与推理，485页pdf

AI智能体编程：技术、挑战与机遇综述

【国家标准】数据安全技术数据安全风险评估方法

【CMU博士论文】交互式学习的进展：替代性反馈机制与自适应因果推理

相关资讯

【CVPR2023】Vita-CLIP:通过多模态提示的视频和文本自适应CLIP

【CVPR2023】Vita-CLIP:通过多模态提示的视频和文本自适应CLIP

专知

5+阅读 · 2023年4月11日

【CVPR2023】基于图像特定提示学习的零样本生成模型自适应

【CVPR2023】基于图像特定提示学习的零样本生成模型自适应

专知

5+阅读 · 2023年4月8日

【CVPR2023】自异构融合知识挖掘的长尾视觉识别

【CVPR2023】自异构融合知识挖掘的长尾视觉识别

专知

5+阅读 · 2023年4月6日

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

专知

29+阅读 · 2021年1月25日

深度学习图像检索(CBIR): 十年之大综述

深度学习图像检索(CBIR): 十年之大综述

专知

66+阅读 · 2020年12月5日

基于深度神经网络的关键词提取，Keywords extraction with DNN

基于深度神经网络的关键词提取，Keywords extraction with DNN

专知

10+阅读 · 2020年5月7日

【ICLR2020-Facebook AI】张量分解的时序知识图谱补全

【ICLR2020-Facebook AI】张量分解的时序知识图谱补全

专知

10+阅读 · 2020年4月14日

高效的文本生成方法 — LaserTagger 现已开源

高效的文本生成方法 — LaserTagger 现已开源

TensorFlow

30+阅读 · 2020年2月27日

【语义分割】一文概览主要语义分割网络：FCN,SegNet,U-Net...

【语义分割】一文概览主要语义分割网络：FCN,SegNet,U-Net...

产业智能官

18+阅读 · 2018年7月26日

Facebook开源MUSE：多语言无监督和监督词向量库

Facebook开源MUSE：多语言无监督和监督词向量库

论智

20+阅读 · 2017年12月23日

相关基金

语义Web知识库补全关键技术研究

国家自然科学基金

14+阅读 · 2017年12月31日

基于DASH的交互式三维视频系统建模

国家自然科学基金

1+阅读 · 2015年12月31日

面向知识库的实体链接技术研究

国家自然科学基金

13+阅读 · 2015年12月31日

不确定知识图谱中面向结构查询的众包清洗研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向甲骨学知识图谱的实体发现及语义关系挖掘研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于Spark的大图数据最优子模式匹配查询方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于神经网络的跨语言实体链指研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

高维复杂结构数据降维

国家自然科学基金

10+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

相关论文

Modelling multivariate extremes through angular-radial decomposition of the density function

Arxiv

0+阅读 · 2024年2月12日

Quantitative knowledge retrieval from large language models

Arxiv

0+阅读 · 2024年2月12日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

476+阅读 · 2023年3月31日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

173+阅读 · 2023年3月24日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员