订单执行是量化金融中的一项基本任务,其目标是完成对特定资产的交易订单的购买或清算。近期在模型无关强化学习(RL)方面的进步为订单执行问题提供了一种数据驱动的解决方案。然而,现有的作品总是优化个体订单的执行,忽视了同时执行多个订单的实践,从而导致了次优和偏见。在本文中,我们首先提出了一种考虑实际限制的多订单执行的多智能体RL(MARL)方法。具体来说,我们将每个智能体视为一个独立的运营者去交易一个特定的订单,同时与彼此保持交流并合作以最大化总体利润。然而,现有的MARL算法通常通过交换其部分观察结果的信息来进行智能体之间的交流,这在复杂的金融市场中效率不高。为了改善协作,我们接着提出了一种可学习的多轮通信协议,供智能体们相互通报预定的行动并据此进行精细化处理。这通过一个新颖的动作价值归因方法来进行优化,该方法与原始学习目标一致且更有效。对两个真实市场的数据进行的实验已经表明,我们的方法实现了显著更好的协作效果,并展现了卓越的性能。

成为VIP会员查看完整内容
15

相关内容

【ICML2023】面向影响力最大化的深度图表示学习与优化
专知会员服务
28+阅读 · 2023年5月6日
【CVPR2023】自异构融合知识挖掘的长尾视觉识别
专知会员服务
15+阅读 · 2023年4月6日
【CVPR2022】基于密集学习的半监督目标检测
专知会员服务
19+阅读 · 2022年4月19日
【CVPR2022】语言引导与基于视觉的深度度量学习的集成
专知会员服务
15+阅读 · 2022年3月17日
【AAAI2022】通过多任务学习改进证据深度学习
专知会员服务
19+阅读 · 2021年12月21日
专知会员服务
21+阅读 · 2021年9月27日
专知会员服务
24+阅读 · 2021年7月8日
专知会员服务
37+阅读 · 2021年4月25日
【ICML2020】持续终身学习的神经主题建模
专知会员服务
37+阅读 · 2020年6月22日
国家自然科学基金
11+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
24+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
Arxiv
155+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
395+阅读 · 2023年3月31日
Arxiv
66+阅读 · 2023年3月26日
Arxiv
10+阅读 · 2020年11月26日
VIP会员
相关VIP内容
【ICML2023】面向影响力最大化的深度图表示学习与优化
专知会员服务
28+阅读 · 2023年5月6日
【CVPR2023】自异构融合知识挖掘的长尾视觉识别
专知会员服务
15+阅读 · 2023年4月6日
【CVPR2022】基于密集学习的半监督目标检测
专知会员服务
19+阅读 · 2022年4月19日
【CVPR2022】语言引导与基于视觉的深度度量学习的集成
专知会员服务
15+阅读 · 2022年3月17日
【AAAI2022】通过多任务学习改进证据深度学习
专知会员服务
19+阅读 · 2021年12月21日
专知会员服务
21+阅读 · 2021年9月27日
专知会员服务
24+阅读 · 2021年7月8日
专知会员服务
37+阅读 · 2021年4月25日
【ICML2020】持续终身学习的神经主题建模
专知会员服务
37+阅读 · 2020年6月22日
相关基金
国家自然科学基金
11+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
24+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员