卷积神经网络通过逐步探索上下文和语义特征在边缘检测方面取得了重大进展。然而,随着感受野的扩大,局部细节逐渐被抑制。最近,视觉Transformer在捕获远程依赖方面表现出出色的能力。受此启发,我们提出了一种新颖的基于Transformer的边缘检测器,边缘检测Transformer(EDTER)。通过同时利用完整的图像上下文信息和详细的局部线索来提取清晰明快的对象边界和有意义的边缘。EDTER 分两个阶段工作。在第一阶段,全局Transformer编码器用于在粗粒度图像块上捕获远程全局上下文。然后在第二阶段,局部Transformer编码器在细粒度补丁上工作以挖掘短程本地线索。每个Transformer编码器后面都有一个精心设计的双向多级聚合解码器,以实现高分辨率特征。最后,全局上下文和局部线索由特征融合模块组合并输入决策头进行边缘预测。在 BSDS500、NYUDv2 和 Multicue 上进行的大量实验证明了 EDTER 与最先进技术相比的优越性。
https://www.zhuanzhi.ai/paper/caf1c942ec21ace11a0a80157fe4d35f