本文研究了这样一种情景:大量处于不同程度医疗困境的人员被困在偏远地区(如北极),必须进行疏散。在此背景下,研究了一种多域行动,即通过直升机或船只两种方式之一进行人员疏散,每种方式都有各自的能力限制。这项研究的目的是确定一种决策策略,其目标是最大限度地增加幸存者人数。为了实现这一目标,我们需要寻求一种策略,在整个行动过程中有效协调直升机撤离和轮船撤离的选择。我们的贡献有两个方面。首先,我们将多领域大规模疏散行动表述为马尔可夫决策过程。其次,由于 "维度诅咒"(curse of dimensionality)使得精确方法不适用,我们采用了人工智能框架,即强化学习(RL),也称为运筹学中的近似动态规划(ADP),来学习近乎最优的策略。利用基于状态聚合的价值函数近似值,我们设计了一种 ADP 算法,以便在具有代表性的规划场景中学习策略。然后,我们在一系列测试场景中应用该策略,并将结果与非协调基准策略进行比较。虽然我们学习到的策略并没有优于所有基准,但我们的结果表明了人工智能可如何用于评估候选策略,并在多领域行动中提供决策支持。

成为VIP会员查看完整内容
25

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
《决策优势与主动权:联合全域指挥与控制》
专知会员服务
57+阅读 · 5月29日
《重新思考战斗人工智能和人类监督》
专知会员服务
64+阅读 · 5月5日
《基于自然语言的人工智能军事决策支持》
专知会员服务
99+阅读 · 1月25日
《JADC2中实现分布式执行: 单元级情报案例研究》中文版
《结合机器人行为以实现安全、智能的执行》
专知会员服务
14+阅读 · 2023年7月4日
《军事背景下能力规划的概念模型》
专知会员服务
119+阅读 · 2023年3月28日
《自主系统的人为控制》
专知会员服务
53+阅读 · 2023年2月13日
【2022新书】深度学习归一化技术,117页pdf
专知
19+阅读 · 2022年11月25日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
33+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
15+阅读 · 2012年12月31日
Arxiv
145+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
360+阅读 · 2023年3月31日
Arxiv
60+阅读 · 2023年3月26日
Arxiv
126+阅读 · 2023年3月24日
Arxiv
19+阅读 · 2023年3月17日
VIP会员
相关VIP内容
《决策优势与主动权:联合全域指挥与控制》
专知会员服务
57+阅读 · 5月29日
《重新思考战斗人工智能和人类监督》
专知会员服务
64+阅读 · 5月5日
《基于自然语言的人工智能军事决策支持》
专知会员服务
99+阅读 · 1月25日
《JADC2中实现分布式执行: 单元级情报案例研究》中文版
《结合机器人行为以实现安全、智能的执行》
专知会员服务
14+阅读 · 2023年7月4日
《军事背景下能力规划的概念模型》
专知会员服务
119+阅读 · 2023年3月28日
《自主系统的人为控制》
专知会员服务
53+阅读 · 2023年2月13日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
33+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
15+阅读 · 2012年12月31日
微信扫码咨询专知VIP会员