Histopathologists establish cancer grade by assessing histological structures, such as glands in prostate cancer. Yet, digital pathology pipelines often rely on grid-based tiling that ignores tissue architecture. This introduces irrelevant information and limits interpretability. We introduce histology-informed tiling (HIT), which uses semantic segmentation to extract glands from whole slide images (WSIs) as biologically meaningful input patches for multiple-instance learning (MIL) and phenotyping. Trained on 137 samples from the ProMPT cohort, HIT achieved a gland-level Dice score of 0.83 +/- 0.17. By extracting 380,000 glands from 760 WSIs across ICGC-C and TCGA-PRAD cohorts, HIT improved MIL models AUCs by 10% for detecting copy number variation (CNVs) in genes related to epithelial-mesenchymal transitions (EMT) and MYC, and revealed 15 gland clusters, several of which were associated with cancer relapse, oncogenic mutations, and high Gleason. Therefore, HIT improved the accuracy and interpretability of MIL predictions, while streamlining computations by focussing on biologically meaningful structures during feature extraction.


翻译:病理学家通过评估组织学结构(如前列腺癌中的腺体)来确定癌症分级。然而,数字病理学流程通常依赖忽略组织结构特征的网格分块方法,这会引入无关信息并限制可解释性。我们提出了一种基于组织学信息的分块方法,该方法利用语义分割从全切片图像中提取腺体,作为多实例学习和表型分析的生物学意义明确的输入图像块。在ProMPT队列的137个样本上进行训练后,该方法在腺体级别的Dice得分达到0.83 +/- 0.17。通过从ICGC-C和TCGA-PRAD队列的760张全切片图像中提取38万个腺体,该方法使多实例学习模型在检测上皮-间质转化相关基因及MYC基因拷贝数变异时的AUC提升了10%,并识别出15个腺体簇,其中多个簇与癌症复发、致癌突变及高Gleason评分相关。因此,该方法通过聚焦特征提取过程中的生物学意义结构,既提升了多实例学习预测的准确性与可解释性,又优化了计算流程。

0
下载
关闭预览

相关内容

癌症是医学术语,其为最常见的恶性肿瘤,亦有人将癌症和恶性肿瘤混合使用。中医学中称岩,为由控制细胞分裂增殖机制失常而引起的疾病。癌细胞除了分裂失控外,还会局部侵入周遭正常组织甚至经由体内循环系统或淋巴系统转移到身体其他部分。
【ICML2023】序列多维自监督学习的临床时间序列建模
专知会员服务
23+阅读 · 2023年7月22日
【ICML2022】药物结合结构预测的几何深度学习
专知会员服务
26+阅读 · 2022年5月24日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
VIP会员
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员