本研究旨在提升军事医疗后送(MEDEVAC)系统性能,降低部署环境中官兵永久伤残或死亡的风险。通过运用整数规划、马尔可夫决策过程(MDP)、近似动态规划(ADP)及机器学习等一系列随机优化技术,深入剖析提升系统效能的关键因素。本研究包含三大核心组成部分。
研究的第一部分着力解决军事医疗后送设施选址-配置问题:医疗后送指挥机构需通过合理确定医疗后送设施(即机动航空医疗中转设施、二级医疗救治机构(MTF)与三级医疗救治机构)的部署位置,并配置相应类型的服务单元(即医疗后送单位、二级病床与三级病床),以实现一小时内最大伤员后送量。成功的后送行动需要同时具备可用的医疗后送单位及具备特定伤情救治能力的医疗救治机构病床。此外,服务单元可用性受工作负荷因素影响。我们开发了近似超立方体排队算法,用于估算考虑不同服务单元之间及同类服务单元间依赖关系的可用服务单元概率。这些概率随后被用于构建提供选址-配置方案的联合覆盖模型。鉴于初始模型高度非线性的特征,我们提出了具有不同模型复杂度的替代性联合覆盖模型,并采用热启动策略提升计算性能的同时确保最优解。本研究结果凸显了在综合医疗后送系统中整合联合服务单元运作对提升系统效能的重要性。
研究的第二部分解决军事医疗后送调度、优先改道、重新部署及送达(DPR-D)问题:医疗后送指挥机构在考虑医疗救治机构能力与容量的前提下,必须有效实施调度、优先改道与重新部署医疗后送单位,同时决策伤员后送(或送达)目标机构。针对该问题,我们构建了折现无限时间域的马尔可夫决策过程模型,并采用集成树型值函数逼近方案的近似策略迭代(API)框架——随机森林(API-RF)与极限梯度提升(API-XGB)——作为近似动态规划求解技术。我们在波斯尼亚-黑塞哥维那高强度作战典型场景中验证了马尔可夫决策过程模型的适用性,并比较了不同近似动态规划求解技术的效能。结果表明,在所有九组测试问题中,API-RF与API-XGB均显著优于当前基准的短视策略(即指派最近可用资源)。此外,API-XGB在所有案例中持续优于API-RF,其中八组案例达到平均2.11%的统计显著优势。
研究的第三部分通过霍克斯过程模拟非均匀到达过程,增强军事医疗后送DPR-D问题的现实性。我们优化了该问题的马尔可夫决策过程建模框架,使其能够捕捉霍克斯过程诱导的到达模式细微特征。具体而言,我们整合了采用多项式狄利克雷分布与滑动窗口策略相结合的预测模型,并通过引入优先经验回放机制(API-XGB-PER)改进前述API-XGB算法以增强学习过程。与研究第二部分类似,我们在波斯尼亚-黑塞哥维那高强度作战典型场景中验证了马尔可夫决策过程模型的适用性,并比较了近似动态规划求解技术的效能。结果显示,API-XGB-PER在所有九组测试案例中均显著优于短视策略,并在其中三组案例中显著优于API-XGB。进一步测试表明,优先经验回放机制的引入稳定了学习过程,并加速收敛至高质量策略。
本研究所构建的模型、求解方法及结论成果可为医疗后送行动的实施与优化提供指导。我们的研究展示了可应用于实践的理论改进方案,能够简化实际场景中的决策流程。