《概率结果下全局最优决策的高效树生成方法》最新30页报告 - 专知VIP

会员服务 ·

1

AI与军事 · 决策 ·

《概率结果下全局最优决策的高效树生成方法》最新30页报告

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

现实世界中诸多问题需进行序列决策，其中每个决策的结果具有概率性与不确定性，且后续行动的可选性受先前行动结果制约。生成适应不确定性、全局最优且随状态空间扩展仍可扩展的策略至关重要。本文提出生成最优决策树（规定不同结果场景下的应执行动作，同时最大化策略期望收益），结合动态规划与混合整数线性优化方法，利用问题特定信息剪除状态空间中无收益贡献的子集，使方案适用于大规模有限状态空间问题。实验证明所提方法能以线性时间复杂度（相对于探索状态数量）找到全局最优决策树。

序列决策是兵棋推演、医疗与网络作战等领域的核心问题。在此类场景中，智能体采取行动达成目标，但每项行动的产出具有离散性、概率性与不确定性，导致面对多可能未来时难以确定最优行动。此外，可用行动存在复杂条件依赖性（制约策略可能性），同时需考虑远期收益。本文开发了一种方法，用于定义适应不同行动结果的最优决策序列，并以决策树形式呈现。

尽管决策树是机器学习中成熟模型，但其传统用途为预测——预测型决策树（DT）的每个分叉对应已知数据特征的组合（其对应结果未知）。而在行动方案（CoA）生成场景中，决策树的应用转向策略生成，允许基于先前行动的不确定结果定义最优行动序列。如图1所示：CoA树的每个节点代表系统状态并规定一项行动，其执行结果引发状态变迁（通过行动结果的概率性分支转移至子节点，可触发新行动）。树终止于叶节点（行动预算耗尽、状态不允许新行动或目标达成获取收益）。

图1：含二元分叉的最优决策树示例（各节点为带行动指令的状态）

本研究核心贡献为生成全局最优决策树的算法与优化模型。这些决策树在最大化策略期望收益的同时，兼顾行动与结果间的复杂依赖关系。通过动态规划（DP）与混合整数优化（MIO）结合，利用问题特定信息剪除状态空间无效子集，使方法可扩展至大规模状态空间问题。虽非首个提出通过部分行动剪枝缩减状态空间的研究（如Pinto与Fern 2014年工作），但本方法在最终决策模型中不牺牲全局最优性。通过示例验证方法有效性，并在随机生成测试案例中展示计算效率——尤其值得注意的是，本方法能以线性时间复杂度（相对于探索状态数）找到最优决策树。

所提框架可生成符合以下特征问题的全局最优决策树：

智能体采取具离散概率结果的行动（改变环境状态）
状态捕获环境所有相关信息及智能体历史行动信息
决策空间有限，终止于目标达成或无可用行动
行动可具复杂依赖关系，例如：
• 先决条件：须先执行某行动并达成特定结果方可尝试后续行动
• 排除条件：若执行某行动并达成特定结果则禁止尝试其他行动

如第3节示例所示，行动间依赖关系可通过行动与结果的逻辑关系集进行数学与图形化表达。

成为VIP会员查看完整内容

4

相关内容

AI与军事

人工智能在军事中可用于多项任务，例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。

推荐！《掌握数字战争艺术：基于分层强化学习的兵棋模拟智能体开发》最新261页

推荐！《掌握数字战争艺术：基于分层强化学习的兵棋模拟智能体开发》最新261页

专知会员服务

66+阅读 · 2024年10月17日

基于强化学习的扩散模型微调：教程与综述

基于强化学习的扩散模型微调：教程与综述

专知会员服务

43+阅读 · 2024年7月20日

《大型语言模型加速生成技术》最新综述

《大型语言模型加速生成技术》最新综述

专知会员服务

48+阅读 · 2024年5月25日

《基于信念的决策建模计算框架》141页

《基于信念的决策建模计算框架》141页

专知会员服务

59+阅读 · 2024年4月27日

《科学机器学习中神经网络结构的比较》最新65页报告

《科学机器学习中神经网络结构的比较》最新65页报告

专知会员服务

27+阅读 · 2024年3月5日

【2023新书】基于模型的机器学习，428页pdf

【2023新书】基于模型的机器学习，428页pdf

专知会员服务

158+阅读 · 2023年11月14日

基于深度强化学习的对手建模方法研究综述

基于深度强化学习的对手建模方法研究综述

专知会员服务

82+阅读 · 2023年4月17日

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

专知会员服务

142+阅读 · 2023年4月5日

Transformer如何做扩散模型？伯克利最新《transformer可扩展扩散模型》论文

Transformer如何做扩散模型？伯克利最新《transformer可扩展扩散模型》论文

专知会员服务

87+阅读 · 2022年12月22日

【干货书】随机优化方法在工程与运筹学中的应用，368页pdf

【干货书】随机优化方法在工程与运筹学中的应用，368页pdf

专知会员服务

75+阅读 · 2022年9月27日

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

专知

51+阅读 · 2023年4月6日

【2022新书】深度学习归一化技术，117页pdf

【2022新书】深度学习归一化技术，117页pdf

专知

27+阅读 · 2022年11月25日

「知识增强预训练语言模型」最新研究综述

「知识增强预训练语言模型」最新研究综述

专知

17+阅读 · 2022年11月18日

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

专知

45+阅读 · 2022年11月5日

面向多智能体博弈对抗的对手建模框架

面向多智能体博弈对抗的对手建模框架

专知

16+阅读 · 2022年9月28日

「智能博弈对抗方法」最新2022综述-博弈论与强化学习综合视角对比分析

「智能博弈对抗方法」最新2022综述-博弈论与强化学习综合视角对比分析

专知

22+阅读 · 2022年8月28日

【经典书】图数据挖掘算法，安全性及应用，256页pdf

【经典书】图数据挖掘算法，安全性及应用，256页pdf

专知

17+阅读 · 2022年8月22日

基于模型的强化学习综述

基于模型的强化学习综述

专知

37+阅读 · 2022年7月13日

《面向军事应用的数据驱动的行为建模》荷兰应用科学研究组织（NTO）

《面向军事应用的数据驱动的行为建模》荷兰应用科学研究组织（NTO）

专知

37+阅读 · 2022年6月2日

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

专知

12+阅读 · 2020年6月9日

粗糙回归模型与算法研究

国家自然科学基金

7+阅读 · 2015年12月31日

求解一类公平疏散问题的高性能混合算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于GEP的可拓策略自组织生成理论与方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

进化算法行为分析及应用

国家自然科学基金

1+阅读 · 2015年12月31日

面向多源大数据的鲁棒聚类模型与算法研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于分层图结构化稀疏低秩表示的目标联合分割方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

关于面板(纵向）数据的动态统计分析

国家自然科学基金

0+阅读 · 2014年12月31日

一种全新的结构修改重分析方法及其应用

国家自然科学基金

0+阅读 · 2014年12月31日

非线性约束全局优化的新方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

169+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

98+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

206+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

79+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

455+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

141+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

76+阅读 · 2023年3月26日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

24+阅读 · 2023年1月13日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

19+阅读 · 2019年1月14日

VIP会员

相关主题

相关VIP内容

推荐！《掌握数字战争艺术：基于分层强化学习的兵棋模拟智能体开发》最新261页

推荐！《掌握数字战争艺术：基于分层强化学习的兵棋模拟智能体开发》最新261页

专知会员服务

66+阅读 · 2024年10月17日

基于强化学习的扩散模型微调：教程与综述

基于强化学习的扩散模型微调：教程与综述

专知会员服务

43+阅读 · 2024年7月20日

《大型语言模型加速生成技术》最新综述

《大型语言模型加速生成技术》最新综述

专知会员服务

48+阅读 · 2024年5月25日

《基于信念的决策建模计算框架》141页

《基于信念的决策建模计算框架》141页

专知会员服务

59+阅读 · 2024年4月27日

《科学机器学习中神经网络结构的比较》最新65页报告

《科学机器学习中神经网络结构的比较》最新65页报告

专知会员服务

27+阅读 · 2024年3月5日

【2023新书】基于模型的机器学习，428页pdf

【2023新书】基于模型的机器学习，428页pdf

专知会员服务

158+阅读 · 2023年11月14日

基于深度强化学习的对手建模方法研究综述

基于深度强化学习的对手建模方法研究综述

专知会员服务

82+阅读 · 2023年4月17日

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

专知会员服务

142+阅读 · 2023年4月5日

Transformer如何做扩散模型？伯克利最新《transformer可扩展扩散模型》论文

Transformer如何做扩散模型？伯克利最新《transformer可扩展扩散模型》论文

专知会员服务

87+阅读 · 2022年12月22日

【干货书】随机优化方法在工程与运筹学中的应用，368页pdf

【干货书】随机优化方法在工程与运筹学中的应用，368页pdf

专知会员服务

75+阅读 · 2022年9月27日

热门VIP内容

开通专知VIP会员享更多权益服务

【NTU博士论文】当深度学习遇上归纳逻辑程序设计

【ICML2025】通过概念对齐与混淆感知校准边界处理视觉-语言模型中的伪标签不平衡问题

【NTU博士论文】当深度学习遇上归纳逻辑程序设计

【CVPR2025】CrayonRobo：面向机器人操作的以对象为中心的提示驱动视觉-语言-动作模型

相关资讯

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

专知

51+阅读 · 2023年4月6日

【2022新书】深度学习归一化技术，117页pdf

【2022新书】深度学习归一化技术，117页pdf

专知

27+阅读 · 2022年11月25日

「知识增强预训练语言模型」最新研究综述

「知识增强预训练语言模型」最新研究综述

专知

17+阅读 · 2022年11月18日

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

专知

45+阅读 · 2022年11月5日

面向多智能体博弈对抗的对手建模框架

面向多智能体博弈对抗的对手建模框架

专知

16+阅读 · 2022年9月28日

「智能博弈对抗方法」最新2022综述-博弈论与强化学习综合视角对比分析

「智能博弈对抗方法」最新2022综述-博弈论与强化学习综合视角对比分析

专知

22+阅读 · 2022年8月28日

【经典书】图数据挖掘算法，安全性及应用，256页pdf

【经典书】图数据挖掘算法，安全性及应用，256页pdf

专知

17+阅读 · 2022年8月22日

基于模型的强化学习综述

基于模型的强化学习综述

专知

37+阅读 · 2022年7月13日

《面向军事应用的数据驱动的行为建模》荷兰应用科学研究组织（NTO）

《面向军事应用的数据驱动的行为建模》荷兰应用科学研究组织（NTO）

专知

37+阅读 · 2022年6月2日

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

专知

12+阅读 · 2020年6月9日

相关基金

粗糙回归模型与算法研究

国家自然科学基金

7+阅读 · 2015年12月31日

求解一类公平疏散问题的高性能混合算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于GEP的可拓策略自组织生成理论与方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

进化算法行为分析及应用

国家自然科学基金

1+阅读 · 2015年12月31日

面向多源大数据的鲁棒聚类模型与算法研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于分层图结构化稀疏低秩表示的目标联合分割方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

关于面板(纵向）数据的动态统计分析

国家自然科学基金

0+阅读 · 2014年12月31日

一种全新的结构修改重分析方法及其应用

国家自然科学基金

0+阅读 · 2014年12月31日

非线性约束全局优化的新方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

169+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

98+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

206+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

79+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

455+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

141+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

76+阅读 · 2023年3月26日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

24+阅读 · 2023年1月13日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

19+阅读 · 2019年1月14日

微信扫码咨询专知VIP会员