Quantum error correction is essential for fault-tolerant quantum computing. However, standard methods relying on active measurements may introduce additional errors. Autonomous quantum error correction (AQEC) circumvents this by utilizing engineered dissipation and drives in bosonic systems, but identifying practical encoding remains challenging due to stringent Knill-Laflamme conditions. In this work, we utilize curriculum learning enabled deep reinforcement learning to discover Bosonic codes under approximate AQEC framework to resist both single-photon and double-photon losses. We present an analytical solution of solving the master equation under approximation conditions, which can significantly accelerate the training process of reinforcement learning. The agent first identifies an encoded subspace surpassing the breakeven point through rapid exploration within a constrained evolutionary time-frame, then strategically fine-tunes its policy to sustain this performance advantage over extended temporal horizons. We find that the two-phase trained agent can discover the optimal set of codewords, i.e., the Fock states $\ket{4}$ and $\ket{7}$ considering the effect of both single-photon and double-photon loss. We identify that the discovered code surpasses the breakeven threshold over a longer evolution time and achieve the state-of-art performance. We also analyze the robustness of the code against the phase damping and amplitude damping noise. Our work highlights the potential of curriculum learning enabled deep reinforcement learning in discovering the optimal quantum error correct code especially in early fault-tolerant quantum systems.


翻译:量子纠错是实现容错量子计算的关键。然而,依赖主动测量的标准方法可能引入额外误差。自主量子纠错通过利用玻色子系统中的工程化耗散与驱动来规避此问题,但由于严格的Knill-Laflamme条件,寻找实际编码方案仍具挑战性。本研究采用课程学习赋能的深度强化学习,在近似自主量子纠错框架下发现能抵抗单光子和双光子损耗的玻色子编码。我们提出了近似条件下求解主方程的解析方法,可显著加速强化学习的训练过程。智能体首先在受限演化时间内通过快速探索识别出超越盈亏平衡点的编码子空间,随后通过策略性微调使其在更长时间尺度上保持性能优势。研究发现,经过两阶段训练的智能体能够发现最优码字集合——在同时考虑单光子和双光子损耗效应时,该集合对应福克态$\\ket{4}$和$\\ket{7}$。实验表明所发现的编码在更长演化时间内超越盈亏平衡阈值,并达到当前最优性能。我们还分析了该编码对相位阻尼与振幅阻尼噪声的鲁棒性。本工作凸显了课程学习赋能的深度强化学习在发现最优量子纠错编码方面的潜力,尤其适用于早期容错量子系统。

0
下载
关闭预览

相关内容

【NeurIPS2022】通过模型转换的可解释强化学习
专知会员服务
38+阅读 · 2022年10月4日
【AAAI2022】通过多任务学习改进证据深度学习
专知会员服务
20+阅读 · 2021年12月21日
专知会员服务
29+阅读 · 2021年6月7日
AAAI 2022 | ProtGNN:自解释图神经网络
专知
10+阅读 · 2022年2月28日
【CVPR 2020 Oral】小样本类增量学习
专知
20+阅读 · 2020年6月26日
国家自然科学基金
1+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
VIP会员
相关VIP内容
【NeurIPS2022】通过模型转换的可解释强化学习
专知会员服务
38+阅读 · 2022年10月4日
【AAAI2022】通过多任务学习改进证据深度学习
专知会员服务
20+阅读 · 2021年12月21日
专知会员服务
29+阅读 · 2021年6月7日
相关资讯
相关基金
国家自然科学基金
1+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员