英特尔AI医疗实战：软硬兼施加速医疗产业变革

2019 年 12 月 28 日 InfoQ

在中国受人工智能影响最大的医疗健康行业中，数据已成为“AI+ 医疗”落地最大阻碍之一，这也导致越来越多的玩家加入智能医疗的赛道。如何将数据作为突破口打造行业 AI 方案？英特尔总结了一份《英特尔医疗健康行业 AI 实战手册》，全方位讲解 AI 实战经验。

2018 年以来，人工智能需求持续爆发，受政策利好影响，核心技术公司与资本市场实现更好对接，企业资金压力得到缓解，落地应用进程加快，医疗健康成为资本关注的重点落地应用方向。投资机构、互联网巨头、传统医疗巨头、传统企业纷纷布局医疗人工智能。

众所周知，我国医疗行业面临的根本问题是医疗资源供需矛盾突出，这也是人工智能医疗的主要发展驱动力。人工智能作为一种创新技术，改变了医疗领域的供给端，给传统医疗机构运作方式带来变革，为现有医疗工作带来流程改进与效率提升，从而催生巨大增量市场。但是由于数据、模型等方面的原因，仍然面临诸多挑战：

1、数据量。模型越复杂，参数越多，所需要的训练样本量就越大。但是对于许多复杂的临床场景而言，所需要的大量可靠的数据却并不容易获得。

2、数据质量。一般而言，健康数据的组织化和标准化程度都不高，且数据分散、有噪声。在条件不好的诊所，还存在电子病历信息缺失或有误、多机构间分散存储等问题，同时接口数据可靠性也很差。

3、模型的可解释性。深度学习模型是个黑盒子。对如何得出结论没有明确的解释，其决策模式的权威性也尚待认证。

4、模型的通用性。首先是模型偏差，比如采用白种人患者数据进行训练的模型，可能在其他种族患者中效果不佳；还有就是模型互操作性差，很难建立一个适用于两种不同电子病历系统汇总的深度学习模型。

5、模型安全。即使是训练有素的图像处理模型，也有可能因为输入图像的扰动而受到不良影响，但这一扰动却无法被人察觉。此外，还存在数据“差之毫厘”就可能带来预测结果“失之千里”的问题，比如，轻微改变患者电子病历数据中心的实验检测值，就会极大地影响模型对住院死亡率的预测结果。

针对这些问题，医疗和人工智能领域专家已经提出多项解决方案，来改善应用环境。英特尔总结了一份《英特尔医疗健康行业 AI 实战手册》，助力 AI+ 医疗落地。

1 医疗行业的图像分割 AI 推理

背景

心血管病一直是危害人类健康的敌人。据统计，心血管疾病每年导致约 1800 万人失去生命。采用心脏磁共振成像检查（MRI），通过对心脏磁共振成像 CMR 图像的定量测量，一直是评估心脏功能、心室容量和心肌组织状况的标准。传统上，心血管专家需要凭借经验对 MRI 影像进行判读，不仅费时费力，而且错误率较高，在解释图像时也容易受到主观因素的影响，导致漏诊和误诊。

现在，西门子医疗正在开展一系列创新医疗 AI 应用的研究，并将成果纳入心脏病学与放射性影像分析的实际应用中。但要将这些 AI 能力真正应用到医疗实践中，还面临着一系列挑战。

首先，AI 应用不能对临床诊疗造成延迟，AI 应用需要与各类检仪器生成的数据保持同步，并保证 AI 推理具备高吞吐、低延迟的特性，才能让基于 AI 的医疗系统服务更多患者。其次，AI 应用应当尽可能与临床诊疗流程进行融合，以便节省时间，并提高测量和诊断之间的一致性和准确性。

为此，西门子与英特尔一起，基于通用处理器平台来开展针对 MRI 影像的判读和测量，实施高效的 AI 推理工作。双方不仅利用深度学习的方法对来自 MRI 的心血管医学影像进行了 AI 判断研究，同时基于全新的第二代英特尔®至强®可扩展处理器平台以及 OpenVINO™ 工具套件等，进行了优化工作，使得推理速度大幅提升，为临床医学诊疗提供了强有力的支撑。

效果

西门子医疗与英特尔一起合作，优化了基于全新的第二代英特尔®至强®可扩展处理器构建的心腔检测和量化模型。该 AI 模型基于 Dense U-net，可对心脏的左右心室进行语义分割，并可扩展到所有四个腔室。AI 模型的输入是跳动心脏的 MRI 图像的堆叠，输出则是识别心脏的区域以及结构，其中每个结构都会被颜色编码。这样可以实现原先需要人工识别标注的过程，从而加快影像研判速度，其整体工作流程如下图所示。

第二代英特尔®至强®可扩展处理器为该 AI 模型的推理提供了高效、灵活和可扩展的平台，特别是与 OpenVINO™ 工具套件的紧密结合，有效加速了针对视觉应用的深度学习推理，提高了诊疗过程中的宝贵诊断、决策速度和准确性。同时，处理器集成的英特尔®深度学习加速技术，具有全新的矢量神经网络指令（VNNI），能够进一步加速深度学习中的各种计算密集型操作，让图像分类、图像分割、目标检测等 AI 应用在英特尔®处理器平台上的推理效率变得更高。

英特尔®深度学习加速技术对 INT8 良好的支持能力，使其可以将 FP32 训练模型转化为 INT8，在保持准确性的同时，大幅提升推理速度。

2 AI+Cloud，建设高效医学影像分析能力

云计算技术的快速发展，让信息孤岛问题逐渐得以解决，如下图所示。越来越多的医疗机构开始将相关医技设备及医疗服务过程都通过云的方式链接起来，并在其上构建全医技协同平台、影像协同平台等能力和应用，以平台即服务（Platform as a Service，PaaS）或软件即服务（Software as a Service，SaaS）的方式满足各层级医疗机构的不同需求。

以医学影像数据为例，基于云计算和大数据技术的互联互通，不仅让各医疗机构可以规避过度检查、重复治疗等问题，还有力地打破了数据孤岛的现象，建立起无边界医疗全连接，提高了医疗服务的质量。

同时，通过影像数据的积累和分析，也让基于 AI 的医学影像分析应用日趋走向成熟。现在，基于云技术 +AI 的医学影像分析已经逐渐在各个医疗机构获得部署，并获得良好反馈。

包括英特尔®至强®可扩展处理器、第二代英特尔®至强®可扩展处理器等在内的英特尔® 架构处理器平台，不仅可为基于 AI+Cloud 的智能医疗影像分析系统带来强大的通用计算能力，更可为其提供亟需的并行计算能力。在深度学习模型的推理过程中，往往对并行计算能力有着较高要求，而英特尔® 至强® 可扩展处理器通过引入英特尔®AVX-512，提供了更高效的单指令多数据流（Single InstructionMultipleData，SIMD）执行效率，让系统获得了更强大的并行计算加速能力。

同时，英特尔®数学核心函数库（Intel®MathKernelLibrary，英特尔® MKL）、英特尔®MKL-DNN 的加入，可以进一步提升 AI 模型的工作效率，其主要通过以下三个方面来提升人工智能模型性能：

使用 CacheBlocking 技术优化数据缓存，提高数据命中率；
对神经网络中的常用算子进行并行化与向量化优化；
使用 Winograd 算法级优化。

而全新的第二代英特尔®至强®可扩展处理器中加入的英特尔®深度学习加速技术，让深度学习推理可以使用 INT8 来获得更佳的性能表现。

英特尔®至强®可扩展处理器平台上，以单幅胸部 Dicom 数据执行 R-FCN 模型为例，来自某应用的数据表明，英特尔®至强®金牌 6148 处理器经过优化，可以把性能提升近 5 倍。

在西安盈谷的合作案例中，一方面，西安盈谷基于目标侦测神经网络模型构建了一系列医学影像分析处理应用，并采用英特尔® 架构处理器执行高效率的模型推理；另一方面，西安盈谷也将其 CloudIDT 智能应用与医学影像处理及分析云计算 @iMAGES 核心引擎等结合起来，提供了强劲的影像大数据在线智能处理能力。

结合基于英特尔®架构的处理器提供的强劲算力，以及 @iMAGES 核心引擎提供的基于云端的强大正电子发射计算机断层显像（PositronEmissionTomographyCT，PET-CT）融合能力，不仅能够提供基于形态学和功能的“热力图”，还可以对影像做出半定量化的标准化摄取值（StandardUptakeValue，SUV）分析，而这些影像又可通过 CloudIDT 智能系统中的 R-FCN 目标侦测神经网络，进一步执行肿瘤等疾病的鉴别和定量分析。

在出色的硬件性能基础上，英特尔还通过对 Caffe、TensorFlow 等人工智能框架的优化，进一步提升了西安盈谷 CloudIDT 智能系统的执行效率。通过对 R-FCN 模型的优化，模型裁剪融合带来了近 30% 的性能提升，而进一步优化 OpenMP 多线程实现方案后，性能再度提升 40%~50%。

为不断挖掘目前主流 AI 框架在基于英特尔®架构的平台上的潜力，英特尔对这些框架开展了多方位的优化工作。面向英特尔®架构优化的 Caffe 框架通过代码矢量化、借助 OpenMP 并行化等优化手段，使模型整体性能相较 BLVCCaffe 获得巨大提升，在与西安盈谷 CloudIDT 智能应用、医学影像处理及分析云计算 @iMAGES 核心引擎等应用结合后，已在肺结节诊断等一大批关键场景中建立起“AI+Cloud”的智能辅助诊断系统能力。

3 基于深度学习的病理切片分析方法的优化

随着基于 AI 的图像处理与分析技术获得巨大进步，各个医疗机构均不遗余力地开展了基于深度学习或机器学习的病理切片分析方法，并取得了良好的成效。例如通过 ResNet50 网络进行的深度学习模型训练，可用于执行肿瘤病理组织的辨识工作。尽管其得到的肿瘤预测热学图依然存在噪声等问题，但已经可以像病理科医生一样，以不同的放大倍数来检查病理切片图像。实验表明，医疗机构有可能通过训练一个深度网络模型，使其不仅能够具备专业的检测技术，还能有超快的检测速度和无限的工作时间。

在英特尔®处理器平台上进行基于深度学习的病理切片分析方法的构建和优化，可以为用户带来以下几个方面的收益：

病理切片图像每个文件容量都动辄有数十、上百 MB。传统上，由于存储空间的限制，训练中设定的 Batch_Size 都偏小，由此会带来训练时间的增加。而采用基于英特尔® 架构处理器平台，服务器具备了大内存（普遍具备数 TB 乃至数十 TB），可以让 Batch_Size 轻松设置至 100 以上，能够加快训练速度；
基于 3DXPoint™存储介质构建的英特尔®傲腾™数据中心级持久内存的引入，让至强可扩展平台的优势得到进一步加强。与昂贵的动态随机存取存储器（DynamicRandom-AccessMemory，DRAM）内存相比，英特尔®傲腾™数据中心级持久内存大容量和非易失性的特性，及其在实现容量扩展时更低的成本优势，可以有效提升执行模型训练和推理的服务器的内存密度以及计算效率，并大幅降低 TCO；
英特尔®至强®可扩展处理器创新的微架构，包括更多数量的核心、更高并发度的线程和更充沛的高速缓存，配合它集成的大量硬件增强技术，特别是英特尔®AVX-512 等，都能为 AI 应用提供更强的算力。

江丰生物联合英特尔构建的基于宫颈 LBP 切片的宫颈癌筛查 AI 解决方案，主要工作流程如下图所示，系统在输入图片后，经由数据预处理、分类卷积神经网络和后处理阶段，分别得到阳性预测和阴性预测。对于阳性预测，方案则进行第二阶段的目标侦测网络（基于 Resnet50）模型的训练，然后进行阳性识别的推理过程，并交由医生做最终审查。

利用深度学习的方法来对病理切片图像等做出快速检测，不仅可以大大提升医疗机构病理检测的生产力，消弭因专业病理科医生不足带来的一系列问题，也能为病患带去更精确、更及时的治疗方案。目前，基于图像分类和目标检测的病理切片检测 AI 应用，已在众多医疗机构进行了落地部署，并获得良好的反馈。

英特尔®架构处理器平台、面向英特尔®架构优化的 Caffe、英特尔®深度学习加速技术等在内的一系列英特尔先进产品和技术，已在众多应用场景中，助力基于深度学习的病理切片检测应用大幅提升其工作效率。例如英特尔® 架构处理器平台对大内存的良好支持，使得在模型训练中可以设定更大的 Batch_Size，从而大幅提升训练效率；再如面向英特尔®架构优化的 Caffe，以及英特尔®深度学习加速技术对 INT8 的良好支持，可以有效提升推理效率，提升病理切片分析的实时性。

4 写在最后

从 1998 年英特尔就与医疗健康领域结缘，与 Communi Health 合作，帮助患者和医生更好地管理慢性疾病。如今已有 20 年，英特尔一直关注医疗健康数字化、药物治疗精确化、分布式合作治疗等重要议题。

透过与东软、西门子、解放军总医院、盈谷的合作，英特尔已经在推理医学影像、医学影像分析、病理切片分析、药物研发等领域大展身手。

依托自身算法优势以及软硬件能力，英特尔如同一个计算能力极强的大脑，提供智能化的解决方案，与英特尔合作的多方医院、药企、科技公司就像人的躯干，为多个医疗应用环节输入能量和能效。

英特尔凭借自身能力在医院、药企、科技公司实现互联互通，在助力合作机构加速的过程不断打磨其技术能力。英特尔将 AI+ 医疗的应用，深入产业实际落地，与医院、药物研发方等强强联合，积累 AI 落地经验，成为助力医疗行业变革的加速器，不仅为行业带来巨变，也让健康医疗从业者的分析能力稳步提升。

想要了解更多关于 AI + 医疗的技术实践，可扫描下方二维码下载《英特尔医疗健康行业 AI 实战手册》。