【AAAI2025】SAIL：面向样本的上下文学习用于文档信息提取 - 专知VIP

会员服务 ·

1

AAAI 2025 · 上下文学习 · 信息抽取 ·

【AAAI2025】SAIL：面向样本的上下文学习用于文档信息提取

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

文档信息提取（DIE）旨在从视觉丰富文档（VRDs）中提取结构化信息。以往的全训练方法已展示出强大的性能，但在面对未见数据时可能存在泛化困难。相比之下，无训练方法利用强大的预训练模型，如大语言模型（LLMs），通过少量示例处理各种下游任务。然而，无训练方法在文档信息提取（DIE）中面临两个主要挑战：（1）理解VRD中布局与文本元素之间的复杂关系；（2）为预训练模型提供准确的指导。为解决这些挑战，我们提出了面向样本的上下文学习（SAIL）方法。SAIL引入了细粒度的实体级文本相似度，促进了LLMs的深度文本分析，并结合了布局相似度，增强了对VRD中布局的分析。此外，SAIL为各种面向样本的示例制定了统一的上下文学习（ICL）提示模板，使得为每个示例提供定制化的提示，能够为预训练模型提供精确的指导。我们在FUNSD、CORD和SROIE基准数据集上进行了广泛实验，使用了多种基础模型（例如，LLMs），结果表明，我们的SAIL方法在无训练基准方法中表现出色，甚至接近全训练方法，展示了我们方法的优越性和泛化能力。代码 — https://github.com/sky-goldfish/SAIL

成为VIP会员查看完整内容

4

相关内容

AAAI 2025

【ACL2024】DoRA：通过动态秩分布增强参数高效微调

【ACL2024】DoRA：通过动态秩分布增强参数高效微调

专知会员服务

18+阅读 · 5月28日

【CVPR2024】VP3D：释放二维视觉提示以进行文本到三维生成

【CVPR2024】VP3D：释放二维视觉提示以进行文本到三维生成

专知会员服务

21+阅读 · 3月26日

【CVPR2024】用于文本到图像生成的判别性探测和调整

【CVPR2024】用于文本到图像生成的判别性探测和调整

专知会员服务

14+阅读 · 3月11日

【WWW2024】LLM 中的一致性引导知识检索和去噪用于零样本文档级关系三元组抽取

【WWW2024】LLM 中的一致性引导知识检索和去噪用于零样本文档级关系三元组抽取

专知会员服务

22+阅读 · 1月27日

【CVPR2023】GeoLayoutLM:视觉信息提取的几何预训练

【CVPR2023】GeoLayoutLM:视觉信息提取的几何预训练

专知会员服务

30+阅读 · 2023年4月25日

【CVPR2022】语言引导与基于视觉的深度度量学习的集成

【CVPR2022】语言引导与基于视觉的深度度量学习的集成

专知会员服务

15+阅读 · 2022年3月17日

【NeuraIPS2021】HSVA:面向零样本学习的分层语义视觉自适应

专知会员服务

12+阅读 · 2021年10月1日

【ACL2021】可学习知识引导的事件因果关系识别数据增强方法

专知会员服务

33+阅读 · 2021年8月11日

【WWW2021】高效的非抽样知识图谱嵌入

专知会员服务

37+阅读 · 2021年4月25日

【ICLR2021】IEPT:用于少样本学习的实例级和片段级代理任务

【ICLR2021】IEPT:用于少样本学习的实例级和片段级代理任务

专知会员服务

13+阅读 · 2021年2月15日

【AAAI2021】对比聚类，Contrastive Clustering

【AAAI2021】对比聚类，Contrastive Clustering

专知

25+阅读 · 2021年1月30日

【图神经网络多模态检索】Multi-Modal Retrieval using Graph Neural Networks

【图神经网络多模态检索】Multi-Modal Retrieval using Graph Neural Networks

专知

12+阅读 · 2020年10月9日

【NeurIPS2020-MIT】子图神经网络，Subgraph Neural Networks

【NeurIPS2020-MIT】子图神经网络，Subgraph Neural Networks

专知

38+阅读 · 2020年9月30日

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

专知

11+阅读 · 2020年8月28日

【KDD2020】更深的图神经网络，Towards Deeper Graph Neural Networks

【KDD2020】更深的图神经网络，Towards Deeper Graph Neural Networks

专知

45+阅读 · 2020年7月22日

【MIT】最优传输图神经网络，Optimal Transport Graph Neural Networks

【MIT】最优传输图神经网络，Optimal Transport Graph Neural Networks

专知

18+阅读 · 2020年6月22日

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

专知

17+阅读 · 2020年6月7日

【IJCAI2020】基于生成对抗模仿学习的多模态模仿学习算法框架

【IJCAI2020】基于生成对抗模仿学习的多模态模仿学习算法框架

专知

19+阅读 · 2020年5月26日

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

专知

11+阅读 · 2020年3月17日

【Uber AI新论文】持续元学习，Learning to Continually Learn

【Uber AI新论文】持续元学习，Learning to Continually Learn

专知

19+阅读 · 2020年2月27日

语义Web知识库补全关键技术研究

国家自然科学基金

11+阅读 · 2017年12月31日

视觉识别中的实用鲁棒回归技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于上下文精化的并发对象活性的描述及验证

国家自然科学基金

0+阅读 · 2015年12月31日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于最大相关熵准则的支持向量机模型与算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于神经网络的跨语言实体链指研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

27+阅读 · 2015年12月31日

纵向数据的动态半参数建模及其统计推断

国家自然科学基金

0+阅读 · 2014年12月31日

基于结构学习的非平行支持向量机最优化方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

How to build your latent Markov model -- the role of time and space

Arxiv

0+阅读 · 12月23日

Spatial function-on-function regression

Arxiv

0+阅读 · 12月23日

FedGA: Federated Learning with Gradient Alignment for Error Asymmetry Mitigation

Arxiv

0+阅读 · 12月21日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

158+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

91+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

181+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

408+阅读 · 2023年3月31日

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Arxiv

20+阅读 · 2023年3月21日

A survey and taxonomy of loss functions in machine learning

Arxiv

22+阅读 · 2023年1月13日

Augmentation for small object detection

Augmentation for small object detection

Arxiv

11+阅读 · 2019年2月19日

VIP会员

相关主题

上下文学习

相关VIP内容

【ACL2024】DoRA：通过动态秩分布增强参数高效微调

【ACL2024】DoRA：通过动态秩分布增强参数高效微调

专知会员服务

18+阅读 · 5月28日

【CVPR2024】VP3D：释放二维视觉提示以进行文本到三维生成

【CVPR2024】VP3D：释放二维视觉提示以进行文本到三维生成

专知会员服务

21+阅读 · 3月26日

【CVPR2024】用于文本到图像生成的判别性探测和调整

【CVPR2024】用于文本到图像生成的判别性探测和调整

专知会员服务

14+阅读 · 3月11日

【WWW2024】LLM 中的一致性引导知识检索和去噪用于零样本文档级关系三元组抽取

【WWW2024】LLM 中的一致性引导知识检索和去噪用于零样本文档级关系三元组抽取

专知会员服务

22+阅读 · 1月27日

【CVPR2023】GeoLayoutLM:视觉信息提取的几何预训练

【CVPR2023】GeoLayoutLM:视觉信息提取的几何预训练

专知会员服务

30+阅读 · 2023年4月25日

【CVPR2022】语言引导与基于视觉的深度度量学习的集成

【CVPR2022】语言引导与基于视觉的深度度量学习的集成

专知会员服务

15+阅读 · 2022年3月17日

【NeuraIPS2021】HSVA:面向零样本学习的分层语义视觉自适应

专知会员服务

12+阅读 · 2021年10月1日

【ACL2021】可学习知识引导的事件因果关系识别数据增强方法

专知会员服务

33+阅读 · 2021年8月11日

【WWW2021】高效的非抽样知识图谱嵌入

专知会员服务

37+阅读 · 2021年4月25日

【ICLR2021】IEPT:用于少样本学习的实例级和片段级代理任务

【ICLR2021】IEPT:用于少样本学习的实例级和片段级代理任务

专知会员服务

13+阅读 · 2021年2月15日

热门VIP内容

相关资讯

【AAAI2021】对比聚类，Contrastive Clustering

【AAAI2021】对比聚类，Contrastive Clustering

专知

25+阅读 · 2021年1月30日

【图神经网络多模态检索】Multi-Modal Retrieval using Graph Neural Networks

【图神经网络多模态检索】Multi-Modal Retrieval using Graph Neural Networks

专知

12+阅读 · 2020年10月9日

【NeurIPS2020-MIT】子图神经网络，Subgraph Neural Networks

【NeurIPS2020-MIT】子图神经网络，Subgraph Neural Networks

专知

38+阅读 · 2020年9月30日

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

专知

11+阅读 · 2020年8月28日

【KDD2020】更深的图神经网络，Towards Deeper Graph Neural Networks

【KDD2020】更深的图神经网络，Towards Deeper Graph Neural Networks

专知

45+阅读 · 2020年7月22日

【MIT】最优传输图神经网络，Optimal Transport Graph Neural Networks

【MIT】最优传输图神经网络，Optimal Transport Graph Neural Networks

专知

18+阅读 · 2020年6月22日

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

专知

17+阅读 · 2020年6月7日

【IJCAI2020】基于生成对抗模仿学习的多模态模仿学习算法框架

【IJCAI2020】基于生成对抗模仿学习的多模态模仿学习算法框架

专知

19+阅读 · 2020年5月26日

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

专知

11+阅读 · 2020年3月17日

【Uber AI新论文】持续元学习，Learning to Continually Learn

【Uber AI新论文】持续元学习，Learning to Continually Learn

专知

19+阅读 · 2020年2月27日

相关基金

语义Web知识库补全关键技术研究

国家自然科学基金

11+阅读 · 2017年12月31日

视觉识别中的实用鲁棒回归技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于上下文精化的并发对象活性的描述及验证

国家自然科学基金

0+阅读 · 2015年12月31日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于最大相关熵准则的支持向量机模型与算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于神经网络的跨语言实体链指研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

27+阅读 · 2015年12月31日

纵向数据的动态半参数建模及其统计推断

国家自然科学基金

0+阅读 · 2014年12月31日

基于结构学习的非平行支持向量机最优化方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

相关论文

How to build your latent Markov model -- the role of time and space

Arxiv

0+阅读 · 12月23日

Spatial function-on-function regression

Arxiv

0+阅读 · 12月23日

FedGA: Federated Learning with Gradient Alignment for Error Asymmetry Mitigation

Arxiv

0+阅读 · 12月21日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

158+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

91+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

181+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

408+阅读 · 2023年3月31日

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Arxiv

20+阅读 · 2023年3月21日

A survey and taxonomy of loss functions in machine learning

Arxiv

22+阅读 · 2023年1月13日

Augmentation for small object detection

Augmentation for small object detection

Arxiv

11+阅读 · 2019年2月19日

微信扫码咨询专知VIP会员