高频交易(HFT)在短时间尺度内执行算法交易,近年来已占据了加密货币市场的大部分份额。除了传统的量化交易方法外,强化学习(RL)由于其处理高维金融数据和解决复杂序列决策问题的强大能力,已成为高频交易的另一种有吸引力的方法。例如,分层强化学习(HRL)通过训练一个路由器从代理池中选择一个子代理来执行当前交易,已在秒级高频交易中显示出其前景。然而,现有的高频交易强化学习方法仍存在一些缺陷:1)标准的基于RL的交易代理面临过拟合问题,无法根据金融背景有效调整策略;2)由于市场条件的快速变化,由单个代理做出的投资决策通常是片面的且高度偏向的,这可能在极端市场中导致重大损失。为了解决这些问题,我们提出了一种新颖的记忆增强的上下文感知强化学习方法,称为MacroHFT,该方法包含两个训练阶段:1)首先,我们根据各种金融指标(特别是市场趋势和波动性)分解市场数据,训练多种类型的子代理,每个代理拥有一个条件适配器,根据市场条件调整其交易策略;2)然后,我们训练一个超代理来混合这些子代理的决策,并输出一个能够应对快速市场波动的一致盈利的元策略,同时配备记忆机制以增强决策能力。在各种加密货币市场上的大量实验表明,MacroHFT在分钟级交易任务中可以达到最先进的性能。代码已发布在 https://github.com/ZONG0004/MacroHFT。

成为VIP会员查看完整内容
15

相关内容

【ACL2024】大型语言模型的稀疏加速训练
专知会员服务
21+阅读 · 6月4日
【WWW2024】知识数据对齐的弱监督异常检测
专知会员服务
20+阅读 · 2月7日
【NeurIPS2023】强化学习中的概率推理:正确的方法
专知会员服务
26+阅读 · 2023年11月25日
【CVPR2023】GeoLayoutLM:视觉信息提取的几何预训练
专知会员服务
29+阅读 · 2023年4月25日
专知会员服务
38+阅读 · 2021年5月16日
综述| 当图神经网络遇上强化学习
图与推荐
25+阅读 · 2022年7月1日
【KDD2020】图神经网络生成式预训练
专知
22+阅读 · 2020年7月3日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
38+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
31+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
22+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2012年12月31日
Arxiv
142+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
349+阅读 · 2023年3月31日
Arxiv
123+阅读 · 2023年3月24日
Arxiv
18+阅读 · 2023年3月17日
VIP会员
相关VIP内容
【ACL2024】大型语言模型的稀疏加速训练
专知会员服务
21+阅读 · 6月4日
【WWW2024】知识数据对齐的弱监督异常检测
专知会员服务
20+阅读 · 2月7日
【NeurIPS2023】强化学习中的概率推理:正确的方法
专知会员服务
26+阅读 · 2023年11月25日
【CVPR2023】GeoLayoutLM:视觉信息提取的几何预训练
专知会员服务
29+阅读 · 2023年4月25日
专知会员服务
38+阅读 · 2021年5月16日
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
38+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
31+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
22+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2012年12月31日
微信扫码咨询专知VIP会员