【ACL2021】Hi-Transformer：一种具有层次化和交互式特点的长文档建模结构 - 专知VIP

会员服务 ·

0

Transformer · ACL 2021 ·

2021 年 8 月 4 日

【ACL2021】Hi-Transformer：一种具有层次化和交互式特点的长文档建模结构

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

文档则是 NLP 领域常见的文本类型，其长度通常较长，如果用 Transformer 去建模长文档，计算开销会很大。所以，通常的做法是对长文档进行截断，但是这样会造成文档输入信息不全，影响最终的文档建模效果。

对此，微软亚洲研究院的研究员们注意到，长文档通常由多个句子组成，不同句子的语义既相对完整自洽。基于这两点，研究员们提出了一种层次化 (Hierarchical) 和交互式 (Interactive) 的Transformer 结构：Hi-Transformer，来实现高效和准确的长文档建模，

Hi-Transformer 的结构非常简单。首先使用 Sentence Transformer 来学习每个句子的语义表示。然后使用 Document Transformer，从文档内部所有句子的语义表示中建模整个文档的 Global context，并得到 Document context-aware 的句子语义表示，进而将其输入到另一个 Sentence Transformer 中，以实现利用 Global document context 来增强每个句子语义学习的目标。最后，使用层次池化方法获得文档的表示。

成为VIP会员查看完整内容

13

相关内容

Transformer

Transformer是谷歌发表的论文《Attention Is All You Need》提出一种完全基于Attention的翻译架构

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【KDD2021】TUTA: 通用表格预训练的树结构Transformer

专知会员服务

25+阅读 · 2021年8月22日

【ACL2021】利用自标注的词对齐提升预训练跨语言语言模型

专知会员服务

17+阅读 · 2021年8月13日

【ACL2021】基于图表示的多元关系链接预测

专知会员服务

34+阅读 · 2021年8月9日

【WWW2021】实体自适应语义依赖图立场检测

专知会员服务

22+阅读 · 2021年4月15日

ECML-PKDD20 | 基于时序异质交互图表示学习的商品推荐

专知会员服务

33+阅读 · 2021年2月12日

【AAAI2021】从类表单文档中提取零样本结构化信息:使用键和触发器进行预训练

专知会员服务

8+阅读 · 2021年2月4日

【KDD2020】通用文档预训练模型LayoutLM：文档结构信息和视觉信息进行建模，让模型在预训练阶段进行多模态对齐。

【KDD2020】通用文档预训练模型LayoutLM：文档结构信息和视觉信息进行建模，让模型在预训练阶段进行多模态对齐。

专知会员服务

32+阅读 · 2020年8月23日

【ACL20-哈工大】基于图注意力网络的多粒度机器阅读理解文档建模

【ACL20-哈工大】基于图注意力网络的多粒度机器阅读理解文档建模

专知会员服务

42+阅读 · 2020年7月1日

【CVPR 2020-人大】基于层次图推理的细粒度文本视频跨模态检索

【CVPR 2020-人大】基于层次图推理的细粒度文本视频跨模态检索

专知会员服务

67+阅读 · 2020年4月5日

【AAAI 2020 |接收论文】使用屏蔽层次Transformer进行会话结构建模，Conversation Structure Modeling Using Masked Hierarchical Transformer，波士顿大学

【AAAI 2020 |接收论文】使用屏蔽层次Transformer进行会话结构建模，Conversation Structure Modeling Using Masked Hierarchical Transformer，波士顿大学

专知会员服务

5+阅读 · 2019年11月25日

基于表示模型的文本匹配方法

基于表示模型的文本匹配方法

AINLP

7+阅读 · 2020年5月8日

【CVPR 2020-人大】层次图推理的细粒度文本视频跨模态检索

【CVPR 2020-人大】层次图推理的细粒度文本视频跨模态检索

专知

7+阅读 · 2020年4月5日

论文浅尝 | 基于深度强化学习将图注意力机制融入知识图谱推理

论文浅尝 | 基于深度强化学习将图注意力机制融入知识图谱推理

开放知识图谱

17+阅读 · 2019年12月31日

深度学习的下一步：Transformer和注意力机制

深度学习的下一步：Transformer和注意力机制

云头条

56+阅读 · 2019年9月14日

论文浅尝 | 利用图 Transformer 实现基于知识图谱的文本生成

论文浅尝 | 利用图 Transformer 实现基于知识图谱的文本生成

开放知识图谱

52+阅读 · 2019年9月1日

论文浅尝 | 知识图谱中的链接预测：一种基于层次约束的方法

论文浅尝 | 知识图谱中的链接预测：一种基于层次约束的方法

开放知识图谱

22+阅读 · 2019年7月24日

论文浅尝 | 基于深度序列模型的知识图谱补全

论文浅尝 | 基于深度序列模型的知识图谱补全

开放知识图谱

29+阅读 · 2019年5月19日

深度上下文词向量

深度上下文词向量

微信AI

27+阅读 · 2018年9月13日

利用 Universal Transformer，翻译将无往不利！

利用 Universal Transformer，翻译将无往不利！

谷歌开发者

5+阅读 · 2018年9月4日

赛尔原创 | 基于句法结构与语义信息核函数的搭配关系抽取

赛尔原创 | 基于句法结构与语义信息核函数的搭配关系抽取

哈工大SCIR

3+阅读 · 2017年7月3日

Transformers in Vision: A Survey

Arxiv

0+阅读 · 2021年10月3日

HiFT: Hierarchical Feature Transformer for Aerial Tracking

Arxiv

0+阅读 · 2021年10月2日

BERT got a Date: Introducing Transformers to Temporal Tagging

Arxiv

0+阅读 · 2021年9月30日

A Survey on Visual Transformer

Arxiv

19+阅读 · 2020年12月23日

Efficient Transformers: A Survey

Arxiv

23+阅读 · 2020年9月16日

Hierarchical Graph Pooling with Structure Learning

Arxiv

13+阅读 · 2019年11月14日

Hierarchically-Refined Label Attention Network for Sequence Labeling

Hierarchically-Refined Label Attention Network for Sequence Labeling

Arxiv

3+阅读 · 2019年8月23日

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

Arxiv

16+阅读 · 2019年5月24日

Universal Transformers

Universal Transformers

Arxiv

5+阅读 · 2019年3月5日

Multimodal Sentiment Analysis using Hierarchical Fusion with Context Modeling

Arxiv

11+阅读 · 2018年6月16日

VIP会员

相关主题

相关VIP内容

【KDD2021】TUTA: 通用表格预训练的树结构Transformer

专知会员服务

25+阅读 · 2021年8月22日

【ACL2021】利用自标注的词对齐提升预训练跨语言语言模型

专知会员服务

17+阅读 · 2021年8月13日

【ACL2021】基于图表示的多元关系链接预测

专知会员服务

34+阅读 · 2021年8月9日

【WWW2021】实体自适应语义依赖图立场检测

专知会员服务

22+阅读 · 2021年4月15日

ECML-PKDD20 | 基于时序异质交互图表示学习的商品推荐

专知会员服务

33+阅读 · 2021年2月12日

【AAAI2021】从类表单文档中提取零样本结构化信息:使用键和触发器进行预训练

专知会员服务

8+阅读 · 2021年2月4日

【KDD2020】通用文档预训练模型LayoutLM：文档结构信息和视觉信息进行建模，让模型在预训练阶段进行多模态对齐。

【KDD2020】通用文档预训练模型LayoutLM：文档结构信息和视觉信息进行建模，让模型在预训练阶段进行多模态对齐。

专知会员服务

32+阅读 · 2020年8月23日

【ACL20-哈工大】基于图注意力网络的多粒度机器阅读理解文档建模

【ACL20-哈工大】基于图注意力网络的多粒度机器阅读理解文档建模

专知会员服务

42+阅读 · 2020年7月1日

【CVPR 2020-人大】基于层次图推理的细粒度文本视频跨模态检索

【CVPR 2020-人大】基于层次图推理的细粒度文本视频跨模态检索

专知会员服务

67+阅读 · 2020年4月5日

【AAAI 2020 |接收论文】使用屏蔽层次Transformer进行会话结构建模，Conversation Structure Modeling Using Masked Hierarchical Transformer，波士顿大学

【AAAI 2020 |接收论文】使用屏蔽层次Transformer进行会话结构建模，Conversation Structure Modeling Using Masked Hierarchical Transformer，波士顿大学

专知会员服务

5+阅读 · 2019年11月25日

热门VIP内容

开通专知VIP会员享更多权益服务

《复杂工程系统模型驱动设计决策支持系统：早期设计阶段挑战》最新138页

《日本陆上自卫队2040年作战方式与未来作战研究》最新23页slides

人工智能作为战争武器

《后勤保障》最新23页

相关资讯

基于表示模型的文本匹配方法

基于表示模型的文本匹配方法

AINLP

7+阅读 · 2020年5月8日

【CVPR 2020-人大】层次图推理的细粒度文本视频跨模态检索

【CVPR 2020-人大】层次图推理的细粒度文本视频跨模态检索

专知

7+阅读 · 2020年4月5日

论文浅尝 | 基于深度强化学习将图注意力机制融入知识图谱推理

论文浅尝 | 基于深度强化学习将图注意力机制融入知识图谱推理

开放知识图谱

17+阅读 · 2019年12月31日

深度学习的下一步：Transformer和注意力机制

深度学习的下一步：Transformer和注意力机制

云头条

56+阅读 · 2019年9月14日

论文浅尝 | 利用图 Transformer 实现基于知识图谱的文本生成

论文浅尝 | 利用图 Transformer 实现基于知识图谱的文本生成

开放知识图谱

52+阅读 · 2019年9月1日

论文浅尝 | 知识图谱中的链接预测：一种基于层次约束的方法

论文浅尝 | 知识图谱中的链接预测：一种基于层次约束的方法

开放知识图谱

22+阅读 · 2019年7月24日

论文浅尝 | 基于深度序列模型的知识图谱补全

论文浅尝 | 基于深度序列模型的知识图谱补全

开放知识图谱

29+阅读 · 2019年5月19日

深度上下文词向量

深度上下文词向量

微信AI

27+阅读 · 2018年9月13日

利用 Universal Transformer，翻译将无往不利！

利用 Universal Transformer，翻译将无往不利！

谷歌开发者

5+阅读 · 2018年9月4日

赛尔原创 | 基于句法结构与语义信息核函数的搭配关系抽取

赛尔原创 | 基于句法结构与语义信息核函数的搭配关系抽取

哈工大SCIR

3+阅读 · 2017年7月3日

相关论文

Transformers in Vision: A Survey

Arxiv

0+阅读 · 2021年10月3日

HiFT: Hierarchical Feature Transformer for Aerial Tracking

Arxiv

0+阅读 · 2021年10月2日

BERT got a Date: Introducing Transformers to Temporal Tagging

Arxiv

0+阅读 · 2021年9月30日

A Survey on Visual Transformer

Arxiv

19+阅读 · 2020年12月23日

Efficient Transformers: A Survey

Arxiv

23+阅读 · 2020年9月16日

Hierarchical Graph Pooling with Structure Learning

Arxiv

13+阅读 · 2019年11月14日

Hierarchically-Refined Label Attention Network for Sequence Labeling

Hierarchically-Refined Label Attention Network for Sequence Labeling

Arxiv

3+阅读 · 2019年8月23日

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

Arxiv

16+阅读 · 2019年5月24日

Universal Transformers

Universal Transformers

Arxiv

5+阅读 · 2019年3月5日

Multimodal Sentiment Analysis using Hierarchical Fusion with Context Modeling

Arxiv

11+阅读 · 2018年6月16日

微信扫码咨询专知VIP会员