编译:于洲
审稿:颜芬
糖化血红蛋白(HbA1c)是红细胞中的血红蛋白与血清中的糖类(主要指葡萄糖)通过非酶反应相结合的产物。糖化血红蛋白浓度可有效地反映过去8~12周平均血糖水平。
因Ⅱ型糖尿病的治疗效果与糖化血红蛋白的含量有关。美国的Elevance Health Palo Alto研究人员采用一种结合深度学习、因果推断和网络荟萃分析(Network meta-analysis, NMA)的方法,通过分析大量Ⅱ型糖尿病患者的治疗数据来估计联合疗法对Ⅱ型糖尿病的实际比较疗效。
背景介绍
Ⅱ型糖尿病治疗所支出的金额约占美国总医疗支出的1/4,并且该病的治疗策略具有很大的异质性。虽然治疗指南收录了大量各种组合的抗高血糖治疗方案,但对于病人的优化治疗选择缺并无方法。本文通过研究美国超过100万高危糖尿病患者的真实数据,在美国T2DM患者队列中,对HbA1c≥9%患者的抗高血糖治疗策略进行了为期五年的检查。观察到超过80种不同的药物类别组合策略,从单一疗法到五种不同药物类别的组合。对队列的观察数据进行了使用深度因果模型的网络荟萃分析,根据降低高危人群 HbA1C 的有效性对 10 个临床队列的治疗策略进行排名。每个队列之间的排名不同,并且它们很好地推广到保留测试集中的快照。对于大多数队列,排名前三的治疗方法在降低HbA1c方面的临床和统计学效果优于其他选择。该研究使调整后HbA1c平均降低0.69%,效果显著,并可扩展到其他慢性疾病的治疗优化中。
本文的创新与贡献: * 这是第一项扩展到单药或双联疗法之外的研究,并对数据中观察到的所有治疗方案进行比较,而不限制药物类别的数量; * 根据临床变量对10个队列进行分层分析,使排名更加个性化; * 利用基于深度学习的倾向评分模型进行因果分析,适用于大型多组观察性研究; * 对测试数据进行敏感性分析,评估比较效果排名的意义与广泛推广的程度。
方法介绍
获取实验数据
本文的研究数据来自5年间收集的5640万人的医疗保险索赔,该索赔要求可作为个人健康状况的简明历史记录。本文使用临床过滤器(图1a)初步筛选得到120万T2DM患者,将每位患者的健康史被分成一系列时间快照,由HbA1c≥9%实验室测量确定,到患者的后续HbA1c实验室测量结束,只保留实验室对之间的持续时间为90-365天的“快照”(包含药物治疗史、诊断、操作以及相关实验室的数据),最终得到141,625 名患者“快照”(图1b)。从给定的HbA1c事件开始,到患者时间线中每对HbA1c事件的后续HbA1c实验室测定值结束,以评估治疗策略并计算因果效应。
图1:研究队列定义和数据准备
在药物类别层面,患者在观察的时间内服用的药物组合被视为一种治疗。无论在两次快照期间治疗方案是否改变,本文都评估了HbA1c的变化。如果在短时间内改变了治疗方案,则HbA1c的变化归因于新治疗方案。
定义临床队列
由于HbA1c目标因患者的年龄和健康状态而异,因此本文根据每例患者的年龄和发生HbA1c指数事件时的其他慢性疾病,以及发生HbA1c指数事件时的胰岛素状态,将患者快照分配到10个临床队列的其中一个。本文选择了按年龄/合并症分组的队列,以防止算法对低血糖造成的低HbA1c进行不当优化,并且选择了按HbA1c指数时的胰岛素状态分类的队列作为低胰岛素血症的代表。
实验呈现的快照数量以及队列的治疗策略数量有随年龄和疾病负担而减少的趋势(表1),但这些趋势并不是单调减少的。在所有临床队列中,共有81种独特的治疗方案。在一个队列中观察到的不同治疗策略的数量与当前患者快照的数量相关;人群越大,观察到的治疗策略越独特。
表1:T2DM患者队列的定义和特征
研究人群特征
筛查人群的平均年龄为55岁,基线HbA1c、估算的肾小球滤过率(EGFR)和肌酐实验室值分别为10.5%、94 mL/min/1.72m2和0.9 mg/dL。本文分别获得了28%和16%患者的种族和民族数据,并且未获得收入数据。由于这些变量可作为混杂因素,因此关于患者邮政编码列表区域(ZCTA)的种族构成和收入水平的信息被用作代理。在血糖显著升高的患者人群中,存在多种合并症,其中最常见的是肥胖、心脏病、COPD和肾脏疾病。为了进行模型训练和验证,本文将患者快照分为训练集(80%)和测试集(20%),所有变量均在统计学上匹配。
按亚群优化治疗排序的因果模型
在观察性数据中,治疗组和对照组之间的基础协变量分布存在显著差异,通过BCAUS22方法成功平衡了这些差异。本文在每个队列中独立计算了每种治疗策略相对于其他治疗的混杂因素校正的因果相对效应。
训练与评估方法按照以下步骤进行: A训练: (1)将人口按队列分层; (2)队列神经网络因果分析; (3)队列网络meta分析; (4)队列治疗方法排序 B评估: (1)评估实际治疗与排名治疗的差别; (2)队列因果因果分析
图2:排名生成和分析的示意图
本文进行了网络meta分析,并根据HbA1c的网络综合因果减少对治疗策略进行了排序。每个队列的前10种最有效的治疗策略显示,排名最高的治疗策略对于每个队列都是独特的。
图3:队列中排名最高的治疗策略
GLP-1s和二甲双胍在控制血糖方面非常有效,它们是任何一组排名前十的治疗方案中唯一作为单一疗法出现的类别,它们只出现在一半的队列中,且效果低于前五。
图4:所有队列中所有治疗策略的排名的完整列表
治疗排名对HbA1c降低的因果效应
本文观察到前三种治疗(占所有治疗的2.4%)和所有其他选择之间的患者结局有显著差异,在各队列中,校正混杂因素后的HbA1c平均降幅为0.69%。
图5:治疗排名对HbA1c降低的因果效应
这些差异在临床和统计学上均显著,即使在对接受高排名治疗选择的患者与其他患者之间的差异进行校正后,差异仍持续存在,并且非常好地推广到试验队列。敏感性分析显示前3名、4 ~ 10名和11名及以下治疗策略之间的关系一致。
图6:高、中、低分级治疗策略的敏感性分析
在真实世界观察数据中排序团体处方模式
在控制不佳的糖尿病患者的研究人群中,本文评估了在每个临床队列中为患者提供的高排名治疗策略的分布情况(表2)。在所有队列中,每次快照的平均治疗秩次为28。在较年轻或相对健康的队列中观察到的一致率最低。
在单个患者有多个相关快照的62%病例中,本文分析了连续快照之间的治疗策略差异。这些患者在快照之间转换治疗的总发生率为35%。当患者转换治疗时,其中51%的转换导致新的治疗具有更好的等级(平均提高了13个等级),而49%的转换导致患者的治疗具有更差的等级(平均降低了12个等级)。在所有变化中,治疗级别的平均变化为改善1个等级。
表2:队列治疗排序一致性的现实观察
总结
这项工作可以作为开发临床决策支持工具的基础,以选择或加强T2DM患者的糖尿病治疗。用于确定最佳治疗方案的方法可应用于经过验证的人群,作为指南的补充,以支持许多不同的决策方法。这些发现对慢性疾病的个性化治疗具有重要意义。该方法代表了迈向功能性学习医疗系统的具体步骤,并且可以立即扩展到糖尿病以外的其他具有复杂药物治疗模式的疾病,如高血压、哮喘、慢性阻塞性肺疾病、抑郁症和充血性心力衰竭。这种学习系统可以大大减轻患者的痛苦,并显著降低医疗成本。
参考资料 Belthangady, C., Giampanis, S., Jankovic, I. et al. Causal deep learning reveals the comparative effectiveness of antihyperglycemic treatments in poorly controlled diabetes. Nat Commun 13, 6921 (2022). https://doi.org/10.1038/s41467-022-33732-9