Medical image segmentation is important for computer-aided diagnosis. Good segmentation demands the model to see the big picture and fine details simultaneously, i.e., to learn image features that incorporate large context while keep high spatial resolutions. To approach this goal, the most widely used methods -- U-Net and variants, extract and fuse multi-scale features. However, the fused features still have small "effective receptive fields" with a focus on local image cues, limiting their performance. In this work, we propose Segtran, an alternative segmentation framework based on transformers, which have unlimited "effective receptive fields" even at high feature resolutions. The core of Segtran is a novel Squeeze-and-Expansion transformer: a squeezed attention block regularizes the self attention of transformers, and an expansion block learns diversified representations. Additionally, we propose a new positional encoding scheme for transformers, imposing a continuity inductive bias for images. Experiments were performed on 2D and 3D medical image segmentation tasks: optic disc/cup segmentation in fundus images (REFUGE'20 challenge), polyp segmentation in colonoscopy images, and brain tumor segmentation in MRI scans (BraTS'19 challenge). Compared with representative existing methods, Segtran consistently achieved the highest segmentation accuracy, and exhibited good cross-domain generalization capabilities. The source code of Segtran is released at https://github.com/askerlee/segtran.


翻译:医学图像分割对于计算机辅助诊断很重要。 良好的分解要求模型同时看到大图和细细细节, 即学习包含大背景的图像特征, 同时保持高空间分辨率。 要实现这一目标, 最广泛使用的方法是 U- Net 和 变异、 提取和引信多尺度特性。 但是, 连接功能仍然有小的“ 有效可接收域 ”, 重点是本地图像提示, 限制其性能。 在这项工作中, 我们提议Segtran, 一个基于变压器的替代分解框架, 它拥有无限的“ 有效可接收字段 ”, 甚至高特征分辨率。 Segtran 的核心是一个新的 Squeze- 和 Expanation 变异器: 挤压式关注区块规范了变异器的自我注意力, 并有一个扩展区块学习了多样化的表达方式。 此外, 我们提出了一个新的变压器定位系统, 给图像带来一种感性偏差的连续性。 在 2D 和 3D 医学图像分解任务上进行了实验: Fundus 图像的光盘/ cupd 分解 (REG20 TSegration) 的Segrational decreal decrealalal drecustrismalalation (REduction) roductionalalalaliz roduction roduction roduction) 和 roduction roduction romaismal roduction roduction 。

0
下载
关闭预览

相关内容

图像分割就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。它是由图像处理到图像分析的关键步骤。 所谓图像分割指的是根据灰度、颜色、纹理和形状等特征把图像划分成若干互不交迭的区域,并使这些特征在同一区域内呈现出相似性,而在不同区域间呈现出明显的差异性。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
边缘机器学习,21页ppt
专知会员服务
81+阅读 · 2021年6月21日
专知会员服务
44+阅读 · 2021年6月1日
最新《Transformers模型》教程,64页ppt
专知会员服务
306+阅读 · 2020年11月26日
少标签数据学习,54页ppt
专知会员服务
196+阅读 · 2020年5月22日
深度强化学习策略梯度教程,53页ppt
专知会员服务
178+阅读 · 2020年2月1日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
58+阅读 · 2019年10月17日
BERT/Transformer/迁移学习NLP资源大列表
专知
19+阅读 · 2019年6月9日
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
条件GAN重大改进!cGANs with Projection Discriminator
CreateAMind
8+阅读 · 2018年2月7日
Image Segmentation Using Deep Learning: A Survey
Arxiv
44+阅读 · 2020年1月15日
Arxiv
3+阅读 · 2018年2月12日
VIP会员
相关VIP内容
边缘机器学习,21页ppt
专知会员服务
81+阅读 · 2021年6月21日
专知会员服务
44+阅读 · 2021年6月1日
最新《Transformers模型》教程,64页ppt
专知会员服务
306+阅读 · 2020年11月26日
少标签数据学习,54页ppt
专知会员服务
196+阅读 · 2020年5月22日
深度强化学习策略梯度教程,53页ppt
专知会员服务
178+阅读 · 2020年2月1日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
58+阅读 · 2019年10月17日
Top
微信扫码咨询专知VIP会员