持续学习依然是机器学习领域的一项长期挑战。成功实现持续学习需要不断吸收新的知识,同时保留仍然有用的旧知识。在本论文中,我们提出了一种连贯的持续学习目标:在每个时间步受到计算资源限制的前提下,最大化无限时域平均回报。这一框架使我们能够系统性地分析持续学习智能体的设计与评估,超越仅仅依赖准确率保持或可塑性等零散指标的方法。 论文的第一部分聚焦于基础工具与理论视角的构建,包括:对智能体状态的信息论建模、智能体容量的量化方法,以及持续学习中稳定性–可塑性权衡的形式化定义。第二部分则提出了多种新算法:一种用于缓解神经网络可塑性退化的再生式正则化方法;Conformal Sympow——一种基于Transformer的模型,借助学习型门控与数据依赖旋转机制,实现了高效的长上下文推理;以及一种以多样性驱动的强化学习方法,使智能体具备对环境扰动的少样本鲁棒性。

综上,这些工作有助于将持续学习确立为一个有原则、可操作的机器学习子领域,推动理论与实践的融合。

成为VIP会员查看完整内容
0

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
【阿姆斯特丹博士论文】缓解多任务学习中的偏差
专知会员服务
22+阅读 · 2024年11月1日
论文浅尝 | 采用多层注意力机制的事件检测
开放知识图谱
24+阅读 · 2019年8月24日
【机器学习】深入剖析机器学习中的统计思想
产业智能官
16+阅读 · 2019年1月24日
推荐|机器学习中的模型评价、模型选择和算法选择!
全球人工智能
10+阅读 · 2018年2月5日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Arxiv
170+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
468+阅读 · 2023年3月31日
Arxiv
76+阅读 · 2023年3月26日
Arxiv
169+阅读 · 2023年3月24日
Arxiv
24+阅读 · 2023年3月17日
VIP会员
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员