Portfolio optimization in non-stationary markets is challenging due to regime shifts, dynamic correlations, and the limited interpretability of deep reinforcement learning (DRL) policies. We propose a Segmented Allocation with Momentum-Adjusted Utility for Multi-agent Portfolio Management via Hierarchical Deep Reinforcement Learning (SAMP-HDRL). The framework first applies dynamic asset grouping to partition the market into high-quality and ordinary subsets. An upper-level agent extracts global market signals, while lower-level agents perform intra-group allocation under mask constraints. A utility-based capital allocation mechanism integrates risky and risk-free assets, ensuring coherent coordination between global and local decisions. backtests across three market regimes (2019--2021) demonstrate that SAMP-HDRL consistently outperforms nine traditional baselines and nine DRL benchmarks under volatile and oscillating conditions. Compared with the strongest baseline, our method achieves at least 5\% higher Return, 5\% higher Sharpe ratio, 5\% higher Sortino ratio, and 2\% higher Omega ratio, with substantially larger gains observed in turbulent markets. Ablation studies confirm that upper--lower coordination, dynamic clustering, and capital allocation are indispensable to robustness. SHAP-based interpretability further reveals a complementary ``diversified + concentrated'' mechanism across agents, providing transparent insights into decision-making. Overall, SAMP-HDRL embeds structural market constraints directly into the DRL pipeline, offering improved adaptability, robustness, and interpretability in complex financial environments.


翻译:在非平稳市场中,由于体制转换、动态相关性以及深度强化学习(DRL)策略可解释性有限,投资组合优化面临挑战。我们提出了一种基于分层深度强化学习的多智能体投资组合管理方法——采用动量调整效用的分段配置(SAMP-HDRL)。该框架首先应用动态资产分组将市场划分为高质量子集和普通子集。上层智能体提取全局市场信号,而下层智能体在掩码约束下执行组内配置。一种基于效用的资金分配机制整合了风险资产与无风险资产,确保全局决策与局部决策之间的协调一致。在三种市场体制(2019–2021年)上的回测表明,在波动和震荡的市场条件下,SAMP-HDRL始终优于九种传统基准方法和九种DRL基准模型。与最强的基准方法相比,我们的方法实现了至少高出5%的收益率、5%的夏普比率、5%的索提诺比率和2%的欧米伽比率,且在动荡市场中观察到的收益提升更为显著。消融研究证实,上层-下层协调、动态聚类和资金分配对于鲁棒性不可或缺。基于SHAP的可解释性分析进一步揭示了智能体间互补的“分散化+集中化”机制,为决策过程提供了透明的洞见。总体而言,SAMP-HDRL将结构性市场约束直接嵌入DRL流程中,在复杂的金融环境中提供了更强的适应性、鲁棒性和可解释性。

0
下载
关闭预览

相关内容

在透彻的分析基础之上,购买某种资产以期待未来能保证本金的安全并获得固定的或者非固定的满意回报的理性行为称之投资
一种Agent自主性风险评估框架 | 最新文献
专知会员服务
16+阅读 · 2025年10月24日
【NVDIA】Cosmos世界基础模型平台用于物理人工智能
专知会员服务
27+阅读 · 2025年1月13日
图机器学习 2.2-2.4 Properties of Networks, Random Graph
图与推荐
10+阅读 · 2020年3月28日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员