The cancer prognosis on gigapixel Whole-Slide Images (WSIs) has always been a challenging task. To further enhance WSI visual representations, existing methods have explored image pyramids, instead of single-resolution images, in WSIs. In spite of this, they still face two major problems: high computational cost and the unnoticed semantical gap in multi-resolution feature fusion. To tackle these problems, this paper proposes to efficiently exploit WSI pyramids from a new perspective, the dual-stream network with cross-attention (DSCA). Our key idea is to utilize two sub-streams to process the WSI patches with two resolutions, where a square pooling is devised in a high-resolution stream to significantly reduce computational costs, and a cross-attention-based method is proposed to properly handle the fusion of dual-stream features. We validate our DSCA on three publicly-available datasets with a total number of 3,101 WSIs from 1,911 patients. Our experiments and ablation studies verify that (i) the proposed DSCA could outperform existing state-of-the-art methods in cancer prognosis, by an average C-Index improvement of around 4.6%; (ii) our DSCA network is more efficient in computation -- it has more learnable parameters (6.31M vs. 860.18K) but less computational costs (2.51G vs. 4.94G), compared to a typical existing multi-resolution network. (iii) the key components of DSCA, dual-stream and cross-attention, indeed contribute to our model's performance, gaining an average C-Index rise of around 2.0% while maintaining a relatively-small computational load. Our DSCA could serve as an alternative and effective tool for WSI-based cancer prognosis.


翻译:癌症预后是对千兆像素整张图(WSI)上的病理学对象进行分类的一项具有挑战性的任务。为进一步提高WSI的视觉表现,现有方法探索了WSI中的图像金字塔,而不是单分辨率图像。尽管如此,它们仍面临两个主要问题:高计算成本和多分辨率特征融合中未被注意到的语义差距。为了解决这些问题,本文提出了使用全新视角的双流网络与交叉注意力(DSCA)有效利用WSI金字塔的思路。我们的关键想法是利用两个子流来处理具有两个分辨率的WSI补丁,高分辨率流中设计了一个正方形池化,可显著减少计算成本,提出了一种基于交叉注意力的方法来合理处理双流特征的融合。我们在三个公开数据集上验证了DSCA,共有1,911名患者的3,101个WSI。我们的实验和消融研究验证了以下事实:(i)所提出的DSCA能够胜过现有的最先进方法,在癌症预后方面提高平均C系数约为4.6%; (ii) 相对于典型的现有多分辨率网络而言,我们的DSCA网络在计算中更加高效 - 它具有更多可学习参数(6.31M vs. 860.18K),但计算成本较低(2.51G vs. 4.94G); (iii) DSCA的关键组件双流和交叉注意确实对该模型的性能有所贡献,平均C系数上升约2.0%,同时保持相对较小的计算负荷。我们的DSCA可作为WSI癌症预后的替代和有效工具。

0
下载
关闭预览

相关内容

专知会员服务
21+阅读 · 2021年4月2日
专知会员服务
33+阅读 · 2020年12月25日
100+篇《自监督学习(Self-Supervised Learning)》论文最新合集
专知会员服务
165+阅读 · 2020年3月18日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
GCNet:当Non-local遇见SENet
极市平台
11+阅读 · 2019年5月9日
简评 | Video Action Recognition 的近期进展
极市平台
20+阅读 · 2019年4月21日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
《pyramid Attention Network for Semantic Segmentation》
统计学习与视觉计算组
44+阅读 · 2018年8月30日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
可解释的CNN
CreateAMind
17+阅读 · 2017年10月5日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
On Feature Normalization and Data Augmentation
Arxiv
15+阅读 · 2020年2月25日
Arxiv
19+阅读 · 2018年3月28日
VIP会员
相关资讯
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
GCNet:当Non-local遇见SENet
极市平台
11+阅读 · 2019年5月9日
简评 | Video Action Recognition 的近期进展
极市平台
20+阅读 · 2019年4月21日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
《pyramid Attention Network for Semantic Segmentation》
统计学习与视觉计算组
44+阅读 · 2018年8月30日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
可解释的CNN
CreateAMind
17+阅读 · 2017年10月5日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员