【KDD2024】高频交易中的宏观强化学习：记忆增强的上下文感知强化学习 - 专知VIP

会员服务 ·

9

KDD 2024 · 高频交易 · 分层强化学习 ·

【KDD2024】高频交易中的宏观强化学习：记忆增强的上下文感知强化学习

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

高频交易（HFT）在短时间尺度内执行算法交易，近年来已占据了加密货币市场的大部分份额。除了传统的量化交易方法外，强化学习（RL）由于其处理高维金融数据和解决复杂序列决策问题的强大能力，已成为高频交易的另一种有吸引力的方法。例如，分层强化学习（HRL）通过训练一个路由器从代理池中选择一个子代理来执行当前交易，已在秒级高频交易中显示出其前景。然而，现有的高频交易强化学习方法仍存在一些缺陷：1）标准的基于RL的交易代理面临过拟合问题，无法根据金融背景有效调整策略；2）由于市场条件的快速变化，由单个代理做出的投资决策通常是片面的且高度偏向的，这可能在极端市场中导致重大损失。为了解决这些问题，我们提出了一种新颖的记忆增强的上下文感知强化学习方法，称为MacroHFT，该方法包含两个训练阶段：1）首先，我们根据各种金融指标（特别是市场趋势和波动性）分解市场数据，训练多种类型的子代理，每个代理拥有一个条件适配器，根据市场条件调整其交易策略；2）然后，我们训练一个超代理来混合这些子代理的决策，并输出一个能够应对快速市场波动的一致盈利的元策略，同时配备记忆机制以增强决策能力。在各种加密货币市场上的大量实验表明，MacroHFT在分钟级交易任务中可以达到最先进的性能。代码已发布在 https://github.com/ZONG0004/MacroHFT。

成为VIP会员查看完整内容

15

相关内容

KDD 2024

【ACL2024】大型语言模型的稀疏加速训练

【ACL2024】大型语言模型的稀疏加速训练

专知会员服务

21+阅读 · 6月4日

【WWW2024】知识数据对齐的弱监督异常检测

【WWW2024】知识数据对齐的弱监督异常检测

专知会员服务

20+阅读 · 2月7日

【ICLR2024】为样本高效的强化学习预训练基于目标的模型

【ICLR2024】为样本高效的强化学习预训练基于目标的模型

专知会员服务

30+阅读 · 1月21日

【NeurIPS2023】强化学习中的概率推理：正确的方法

【NeurIPS2023】强化学习中的概率推理：正确的方法

专知会员服务

26+阅读 · 2023年11月25日

【NeurIPS2023】不仅仅是均匀采样：面对不平衡数据集的离线强化学习

【NeurIPS2023】不仅仅是均匀采样：面对不平衡数据集的离线强化学习

专知会员服务

30+阅读 · 2023年10月10日

【CVPR2023】GeoLayoutLM:视觉信息提取的几何预训练

【CVPR2023】GeoLayoutLM:视觉信息提取的几何预训练

专知会员服务

29+阅读 · 2023年4月25日

【CVPR2021教程】深度学习中的归一化技术:方法、分析和应用

专知会员服务

39+阅读 · 2021年6月21日

【ICML2021】多任务学习与元学习的衔接:面向高效训练与有效适应

专知会员服务

31+阅读 · 2021年6月18日

【CVPR2021】密集对比学习的自监督视觉预训练

专知会员服务

38+阅读 · 2021年5月16日

【AAAI2020教程】强化学习中的Exploration-Exploitation in Reinforcement Learning

专知会员服务

99+阅读 · 2020年2月8日

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

专知

34+阅读 · 2023年4月13日

综述| 当图神经网络遇上强化学习

综述| 当图神经网络遇上强化学习

图与推荐

25+阅读 · 2022年7月1日

NLP如何用元学习？李宏毅老师NAACL2022最新《元学习自然语言处理》综述论文阐述最新研究进展

NLP如何用元学习？李宏毅老师NAACL2022最新《元学习自然语言处理》综述论文阐述最新研究进展

专知

23+阅读 · 2022年5月4日

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

专知

15+阅读 · 2020年12月9日

【ACM Multimedia2020】跨模态注意力Transformer模型的深度视频理解

【ACM Multimedia2020】跨模态注意力Transformer模型的深度视频理解

专知

15+阅读 · 2020年8月30日

【KDD2020】图神经网络生成式预训练

【KDD2020】图神经网络生成式预训练

专知

22+阅读 · 2020年7月3日

【IJCAI2020】基于生成对抗模仿学习的多模态模仿学习算法框架

【IJCAI2020】基于生成对抗模仿学习的多模态模仿学习算法框架

专知

17+阅读 · 2020年5月26日

【复旦大学-SP2020】NLP语言模型隐私泄漏风险

【复旦大学-SP2020】NLP语言模型隐私泄漏风险

专知

10+阅读 · 2020年4月20日

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

专知

11+阅读 · 2020年3月31日

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

开放知识图谱

20+阅读 · 2018年9月26日

间接优化的高效Monte Carlo声传播研究

国家自然科学基金

0+阅读 · 2017年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

38+阅读 · 2015年12月31日

视觉识别中的实用鲁棒回归技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

31+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

6+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

22+阅读 · 2015年12月31日

纵向数据的动态半参数建模及其统计推断

国家自然科学基金

0+阅读 · 2014年12月31日

基于结构学习的非平行支持向量机最优化方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

10+阅读 · 2012年12月31日

On the consistency of hyper-parameter selection in value-based deep reinforcement learning

Arxiv

0+阅读 · 6月25日

Personalized federated learning based on feature fusion

Arxiv

0+阅读 · 6月24日

DLP: towards active defense against backdoor attacks with decoupled learning process

Arxiv

0+阅读 · 6月18日

Deep self-supervised learning with visualisation for automatic gesture recognition

Arxiv

0+阅读 · 6月18日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

142+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

77+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

149+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

349+阅读 · 2023年3月31日

Knowledge Graphs: Opportunities and Challenges

Arxiv

123+阅读 · 2023年3月24日

Data-centric Artificial Intelligence: A Survey

Arxiv

18+阅读 · 2023年3月17日

VIP会员

相关主题

分层强化学习

相关VIP内容

【ACL2024】大型语言模型的稀疏加速训练

【ACL2024】大型语言模型的稀疏加速训练

专知会员服务

21+阅读 · 6月4日

【WWW2024】知识数据对齐的弱监督异常检测

【WWW2024】知识数据对齐的弱监督异常检测

专知会员服务

20+阅读 · 2月7日

【ICLR2024】为样本高效的强化学习预训练基于目标的模型

【ICLR2024】为样本高效的强化学习预训练基于目标的模型

专知会员服务

30+阅读 · 1月21日

【NeurIPS2023】强化学习中的概率推理：正确的方法

【NeurIPS2023】强化学习中的概率推理：正确的方法

专知会员服务

26+阅读 · 2023年11月25日

【NeurIPS2023】不仅仅是均匀采样：面对不平衡数据集的离线强化学习

【NeurIPS2023】不仅仅是均匀采样：面对不平衡数据集的离线强化学习

专知会员服务

30+阅读 · 2023年10月10日

【CVPR2023】GeoLayoutLM:视觉信息提取的几何预训练

【CVPR2023】GeoLayoutLM:视觉信息提取的几何预训练

专知会员服务

29+阅读 · 2023年4月25日

【CVPR2021教程】深度学习中的归一化技术:方法、分析和应用

专知会员服务

39+阅读 · 2021年6月21日

【ICML2021】多任务学习与元学习的衔接:面向高效训练与有效适应

专知会员服务

31+阅读 · 2021年6月18日

【CVPR2021】密集对比学习的自监督视觉预训练

专知会员服务

38+阅读 · 2021年5月16日

【AAAI2020教程】强化学习中的Exploration-Exploitation in Reinforcement Learning

专知会员服务

99+阅读 · 2020年2月8日

热门VIP内容

相关资讯

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

专知

34+阅读 · 2023年4月13日

综述| 当图神经网络遇上强化学习

综述| 当图神经网络遇上强化学习

图与推荐

25+阅读 · 2022年7月1日

NLP如何用元学习？李宏毅老师NAACL2022最新《元学习自然语言处理》综述论文阐述最新研究进展

NLP如何用元学习？李宏毅老师NAACL2022最新《元学习自然语言处理》综述论文阐述最新研究进展

专知

23+阅读 · 2022年5月4日

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

专知

15+阅读 · 2020年12月9日

【ACM Multimedia2020】跨模态注意力Transformer模型的深度视频理解

【ACM Multimedia2020】跨模态注意力Transformer模型的深度视频理解

专知

15+阅读 · 2020年8月30日

【KDD2020】图神经网络生成式预训练

【KDD2020】图神经网络生成式预训练

专知

22+阅读 · 2020年7月3日

【IJCAI2020】基于生成对抗模仿学习的多模态模仿学习算法框架

【IJCAI2020】基于生成对抗模仿学习的多模态模仿学习算法框架

专知

17+阅读 · 2020年5月26日

【复旦大学-SP2020】NLP语言模型隐私泄漏风险

【复旦大学-SP2020】NLP语言模型隐私泄漏风险

专知

10+阅读 · 2020年4月20日

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

专知

11+阅读 · 2020年3月31日

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

开放知识图谱

20+阅读 · 2018年9月26日

相关基金

间接优化的高效Monte Carlo声传播研究

国家自然科学基金

0+阅读 · 2017年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

38+阅读 · 2015年12月31日

视觉识别中的实用鲁棒回归技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

31+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

6+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

22+阅读 · 2015年12月31日

纵向数据的动态半参数建模及其统计推断

国家自然科学基金

0+阅读 · 2014年12月31日

基于结构学习的非平行支持向量机最优化方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

10+阅读 · 2012年12月31日

相关论文

On the consistency of hyper-parameter selection in value-based deep reinforcement learning

Arxiv

0+阅读 · 6月25日

Personalized federated learning based on feature fusion

Arxiv

0+阅读 · 6月24日

DLP: towards active defense against backdoor attacks with decoupled learning process

Arxiv

0+阅读 · 6月18日

Deep self-supervised learning with visualisation for automatic gesture recognition

Arxiv

0+阅读 · 6月18日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

142+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

77+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

149+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

349+阅读 · 2023年3月31日

Knowledge Graphs: Opportunities and Challenges

Arxiv

123+阅读 · 2023年3月24日

Data-centric Artificial Intelligence: A Survey

Arxiv

18+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员