DQN 混合RF/VLC网络多用户电力分配 (DQN-Based Multi-User Power Allocation for Hybrid RF/VLC Networks) - 专知论文

会员服务 ·

0

DQN · Networking · 深度Q网络 · Q网络` · Continuity ·

2021 年 2 月 3 日

DQN-Based Multi-User Power Allocation for Hybrid RF/VLC Networks

翻译：DQN 混合RF/VLC网络多用户电力分配

Bekir Sait Ciftler,Abdulmalik Alwarafy,Mohamed Abdallah,Mounir Hamdi

from arxiv, 6 pages, 4 figures, accepted to IEEE ICC 2021

In this paper, a Deep Q-Network (DQN) based multi-agent multi-user power allocation algorithm is proposed for hybrid networks composed of radio frequency (RF) and visible light communication (VLC) access points (APs). The users are capable of multihoming, which can bridge RF and VLC links for accommodating their bandwidth requirements. By leveraging a non-cooperative multi-agent DQN algorithm, where each AP is an agent, an online power allocation strategy is developed to optimize the transmit power for providing users' required data rate. Our simulation results demonstrate that DQN's median convergence time training is 90% shorter than the Q-Learning (QL) based algorithm. The DQN-based algorithm converges to the desired user rate in half duration on average while converging with the rate of 96.1% compared to the QL-based algorithm's convergence rate of 72.3% Additionally, thanks to its continuous state-space definition, the DQN-based power allocation algorithm provides average user data rates closer to the target rates than the QL-based algorithm when it converges.

翻译：本文为由无线电频率(RF)和可见光光通信接入点组成的混合网络提出了基于深Q网络(DQN)的多试剂多用户功率分配算法。用户能够进行多光化,可以连接RF和VLC链接以满足其带宽要求。通过利用不合作的多试DQN算法,每个AP都是代理商,制定了在线电力分配战略,优化传输能力,以提供用户所需的数据率。我们的模拟结果表明,DQN的中位趋同时间培训比基于Q-Learing(QL)的算法短90%。基于DQQN的算法平均半时间与理想用户比率趋同,同时与基于QL的算法的72.3%的趋同率为96.1%,此外,基于DQN的电力分配算法由于其持续的国家空间定义,提供的平均用户数据率比基于QL的算法在合并时的目标比率更接近目标率。

0

相关内容

DQN

深度生成模型综述(中文版)，43页pdf

专知会员服务

183+阅读 · 2020年11月23日

不可错过！UIUC最新《统计强化学习》课程！

专知会员服务

53+阅读 · 2020年9月7日

低秩稀疏矩阵优化问题的模型与算法

专知会员服务

46+阅读 · 2020年7月29日

【论文推荐】Stochastic Graph Neural Networks，随机图神经网络

【论文推荐】Stochastic Graph Neural Networks，随机图神经网络

专知会员服务

69+阅读 · 2020年6月6日

图机器学习-图拉普拉斯算子的离散正则性，141页ppt，Discrete regularity graph Laplacians

专知会员服务

29+阅读 · 2020年6月4日

简明《神经网络数学》手册，16页pdf带你入门，Mathematics of Neural Networks

简明《神经网络数学》手册，16页pdf带你入门，Mathematics of Neural Networks

专知会员服务

68+阅读 · 2020年5月9日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

49+阅读 · 2019年10月17日

Stabilizing Transformers for Reinforcement Learning

Stabilizing Transformers for Reinforcement Learning

专知会员服务

60+阅读 · 2019年10月17日

《DeepGCNs: Making GCNs Go as Deep as CNNs》

《DeepGCNs: Making GCNs Go as Deep as CNNs》

专知会员服务

31+阅读 · 2019年10月17日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

181+阅读 · 2019年10月11日

RL解决'BipedalWalkerHardcore-v2' (SOTA)效率效果均第一及完整源代码

RL解决'BipedalWalkerHardcore-v2' (SOTA)效率效果均第一及完整源代码

CreateAMind

19+阅读 · 2019年7月18日

RL解决'BipedalWalkerHardcore-v2' (SOTA)

RL解决'BipedalWalkerHardcore-v2' (SOTA)

CreateAMind

31+阅读 · 2019年7月17日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

meta learning 17年：MAML SNAIL

meta learning 17年：MAML SNAIL

CreateAMind

11+阅读 · 2019年1月2日

Ray RLlib: Scalable 降龙十八掌

Ray RLlib: Scalable 降龙十八掌

CreateAMind

9+阅读 · 2018年12月28日

【推荐】直接未来预测：增强学习监督学习

【推荐】直接未来预测：增强学习监督学习

机器学习研究会

6+阅读 · 2017年11月24日

【推荐】RNN/LSTM时序预测

【推荐】RNN/LSTM时序预测

机器学习研究会

25+阅读 · 2017年9月8日

【强化学习】NIPS的最佳论文强化学习Value iteration Network 及代码；目前深度学习和增强学习交叉应用最火

【强化学习】NIPS的最佳论文强化学习Value iteration Network 及代码；目前深度学习和增强学习交叉应用最火

产业智能官

6+阅读 · 2017年9月1日

强化学习族谱

强化学习族谱

CreateAMind

26+阅读 · 2017年8月2日

强化学习 cartpole_a3c

强化学习 cartpole_a3c

CreateAMind

9+阅读 · 2017年7月21日

Unified Reinforcement Q-Learning for Mean Field Game and Control Problems

Arxiv

0+阅读 · 2021年3月29日

Reinforcement Learning Random Access for Delay-Constrained Heterogeneous Wireless Networks: A Two-User Case

Arxiv

0+阅读 · 2021年3月27日

Scheduling of Wireless Edge Networks for Feedback-Based Interactive Applications

Arxiv

0+阅读 · 2021年3月27日

iLQR for Piecewise-Smooth Hybrid Dynamical Systems

iLQR for Piecewise-Smooth Hybrid Dynamical Systems

Arxiv

0+阅读 · 2021年3月26日

Reinforcement Learning for Deceiving Reactive Jammers in Wireless Networks

Arxiv

0+阅读 · 2021年3月25日

A Semidefinite Optimization-based Branch-and-Bound Algorithm for Several Reactive Optimal Power Flow Problems

Arxiv

0+阅读 · 2021年3月25日

CHIMERA: A Hybrid Estimation Approach to Limit the Effects of False Data Injection Attacks

Arxiv

0+阅读 · 2021年3月25日

D-ACC: Dynamic Adaptive Cruise Control for Highways with Ramps Based on Deep Q-Learning

Arxiv

0+阅读 · 2021年3月25日

Cluster-GCN: An Efficient Algorithm for Training Deep and Large Graph Convolutional Networks

Arxiv

14+阅读 · 2019年8月8日

Cache-Enabled Dynamic Rate Allocation via Deep Self-Transfer Reinforcement Learning

Arxiv

4+阅读 · 2018年3月30日

VIP会员

文章信息

相关主题

相关VIP内容

深度生成模型综述(中文版)，43页pdf

专知会员服务

183+阅读 · 2020年11月23日

不可错过！UIUC最新《统计强化学习》课程！

专知会员服务

53+阅读 · 2020年9月7日

低秩稀疏矩阵优化问题的模型与算法

专知会员服务

46+阅读 · 2020年7月29日

【论文推荐】Stochastic Graph Neural Networks，随机图神经网络

【论文推荐】Stochastic Graph Neural Networks，随机图神经网络

专知会员服务

69+阅读 · 2020年6月6日

图机器学习-图拉普拉斯算子的离散正则性，141页ppt，Discrete regularity graph Laplacians

专知会员服务

29+阅读 · 2020年6月4日

简明《神经网络数学》手册，16页pdf带你入门，Mathematics of Neural Networks

简明《神经网络数学》手册，16页pdf带你入门，Mathematics of Neural Networks

专知会员服务

68+阅读 · 2020年5月9日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

49+阅读 · 2019年10月17日

Stabilizing Transformers for Reinforcement Learning

Stabilizing Transformers for Reinforcement Learning

专知会员服务

60+阅读 · 2019年10月17日

《DeepGCNs: Making GCNs Go as Deep as CNNs》

《DeepGCNs: Making GCNs Go as Deep as CNNs》

专知会员服务

31+阅读 · 2019年10月17日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

181+阅读 · 2019年10月11日

热门VIP内容

开通专知VIP会员享更多权益服务

以机器速度锁定目标：人工智能的能力与局限

【ICML2025】通过在线世界模型规划的持续强化学习

《美军21世纪医疗抵消战略》

《毁灭算法：解析以色列在加沙的AI军事行动》

相关资讯

RL解决'BipedalWalkerHardcore-v2' (SOTA)效率效果均第一及完整源代码

RL解决'BipedalWalkerHardcore-v2' (SOTA)效率效果均第一及完整源代码

CreateAMind

19+阅读 · 2019年7月18日

RL解决'BipedalWalkerHardcore-v2' (SOTA)

RL解决'BipedalWalkerHardcore-v2' (SOTA)

CreateAMind

31+阅读 · 2019年7月17日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

meta learning 17年：MAML SNAIL

meta learning 17年：MAML SNAIL

CreateAMind

11+阅读 · 2019年1月2日

Ray RLlib: Scalable 降龙十八掌

Ray RLlib: Scalable 降龙十八掌

CreateAMind

9+阅读 · 2018年12月28日

【推荐】直接未来预测：增强学习监督学习

【推荐】直接未来预测：增强学习监督学习

机器学习研究会

6+阅读 · 2017年11月24日

【推荐】RNN/LSTM时序预测

【推荐】RNN/LSTM时序预测

机器学习研究会

25+阅读 · 2017年9月8日

【强化学习】NIPS的最佳论文强化学习Value iteration Network 及代码；目前深度学习和增强学习交叉应用最火

【强化学习】NIPS的最佳论文强化学习Value iteration Network 及代码；目前深度学习和增强学习交叉应用最火

产业智能官

6+阅读 · 2017年9月1日

强化学习族谱

强化学习族谱

CreateAMind

26+阅读 · 2017年8月2日

强化学习 cartpole_a3c

强化学习 cartpole_a3c

CreateAMind

9+阅读 · 2017年7月21日

相关论文

Unified Reinforcement Q-Learning for Mean Field Game and Control Problems

Arxiv

0+阅读 · 2021年3月29日

Reinforcement Learning Random Access for Delay-Constrained Heterogeneous Wireless Networks: A Two-User Case

Arxiv

0+阅读 · 2021年3月27日

Scheduling of Wireless Edge Networks for Feedback-Based Interactive Applications

Arxiv

0+阅读 · 2021年3月27日

iLQR for Piecewise-Smooth Hybrid Dynamical Systems

iLQR for Piecewise-Smooth Hybrid Dynamical Systems

Arxiv

0+阅读 · 2021年3月26日

Reinforcement Learning for Deceiving Reactive Jammers in Wireless Networks

Arxiv

0+阅读 · 2021年3月25日

A Semidefinite Optimization-based Branch-and-Bound Algorithm for Several Reactive Optimal Power Flow Problems

Arxiv

0+阅读 · 2021年3月25日

CHIMERA: A Hybrid Estimation Approach to Limit the Effects of False Data Injection Attacks

Arxiv

0+阅读 · 2021年3月25日

D-ACC: Dynamic Adaptive Cruise Control for Highways with Ramps Based on Deep Q-Learning

Arxiv

0+阅读 · 2021年3月25日

Cluster-GCN: An Efficient Algorithm for Training Deep and Large Graph Convolutional Networks

Arxiv

14+阅读 · 2019年8月8日

Cache-Enabled Dynamic Rate Allocation via Deep Self-Transfer Reinforcement Learning

Arxiv

4+阅读 · 2018年3月30日

微信扫码咨询专知VIP会员