【牛津大学博士论文】序列决策中的迁移学习 - 专知VIP

会员服务 ·

15

序列决策 · 迁移学习 · 牛津大学 (University of Oxford) · 博士论文 ·

2024 年 11 月 10 日

【牛津大学博士论文】序列决策中的迁移学习

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

迁移学习对于提高深度学习模型在序列决策任务中的数据效率和适用性至关重要。然而，确定哪些知识可以迁移以及如何有效利用它仍然是一个尚未解决的难题。近年来在表示学习方面的突破，尤其是在语言和视觉领域，展示了从大规模数据集迁移知识的强大能力。同时，仿真平台和环境设计的进步也为收集多样化、逼真的训练数据开辟了新的可能性。在此背景下，本论文包含的四项研究工作探讨了序列决策任务中不同方面的迁移技术。首先，我们对先前在序列决策中整合自然语言数据和表示的研究进行了全面综述。我们的综述揭示了尚未解决的挑战，并规划了有前景的研究方向，主张更广泛地利用大型语言模型，并开发语义复杂性更高的环境。其次，我们提出并研究了一种用于多模态多任务设置的模块化架构设计，以实现组合泛化。受控实验表明，该设计在观察、动作和指令空间的未见组合上实现了零样本迁移，并有效整合了新的观测模态。第三，我们提出了一种方法，通过迁移源任务中与价值相关的状态特征知识，来引导无监督技能发现，以生成更有用的行为。在连续控制领域的实验表明，我们的方法在状态空间的相关维度上实现了更优的覆盖，并提升了下游任务的表现。最后，我们对非平稳环境中元梯度的分析表明，将优化器作为上下文特征的函数进行学习，可以实现更快的适应速度和更高的整体表现。总的来说，本论文为在序列决策任务中实现有效知识迁移提供了新颖的见解和策略。研究工作展示了整合语言、针对性归纳偏差、适度监督以及元学习自适应带来的优势。

成为VIP会员查看完整内容

24

相关内容

序列决策

【剑桥大学博士论文】使用检索方法增强多模态问答系统

【剑桥大学博士论文】使用检索方法增强多模态问答系统

专知会员服务

36+阅读 · 2024年11月8日

【MIT博士论文】合成数据的视觉表示学习

【MIT博士论文】合成数据的视觉表示学习

专知会员服务

23+阅读 · 2024年8月25日

【伯克利博士论文】神经网络中的结构与表征

【伯克利博士论文】神经网络中的结构与表征

专知会员服务

47+阅读 · 2024年5月12日

【ETHZ博士论文】神经场景表示用于三维重建和场景理解

【ETHZ博士论文】神经场景表示用于三维重建和场景理解

专知会员服务

36+阅读 · 2024年3月15日

【ETHZ博士论文】在弱监督学习中施加和揭示群组结构

【ETHZ博士论文】在弱监督学习中施加和揭示群组结构

专知会员服务

21+阅读 · 2023年10月15日

【伯克利博士论文】现实世界机器人系统控制的鲁棒机器学习

【伯克利博士论文】现实世界机器人系统控制的鲁棒机器学习

专知会员服务

25+阅读 · 2023年5月21日

【UFPE大学博士论文】基于熵损失的鲁棒深度学习

【UFPE大学博士论文】基于熵损失的鲁棒深度学习

专知会员服务

42+阅读 · 2022年11月11日

【伯克利博士论文】学习跨领域的可迁移表示

【伯克利博士论文】学习跨领域的可迁移表示

专知会员服务

47+阅读 · 2022年8月17日

【索邦大学博士论文】实体与关系抽取中的泛化与上下文化

【索邦大学博士论文】实体与关系抽取中的泛化与上下文化

专知会员服务

31+阅读 · 2022年6月20日

深度学习如何用于基因学？新加坡国立Bresson教授《使用与图卷积网络学习解开基因组组装》，51页ppt

深度学习如何用于基因学？新加坡国立Bresson教授《使用与图卷积网络学习解开基因组组装》，51页ppt

专知会员服务

18+阅读 · 2022年6月6日

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

37+阅读 · 2023年4月13日

数据受限条件下的多模态处理技术综述

数据受限条件下的多模态处理技术综述

专知

20+阅读 · 2022年7月16日

综述| 当图神经网络遇上强化学习

综述| 当图神经网络遇上强化学习

图与推荐

34+阅读 · 2022年7月1日

【AI与医学】多模态机器学习精准医疗健康

【AI与医学】多模态机器学习精准医疗健康

专知

17+阅读 · 2022年4月25日

「因果性机器学习」书册，88页pdf概述机器学习中的因果推理

「因果性机器学习」书册，88页pdf概述机器学习中的因果推理

专知

19+阅读 · 2021年3月21日

【KDD2020】动态知识图谱的多事件预测

【KDD2020】动态知识图谱的多事件预测

专知

88+阅读 · 2020年8月31日

【ACM Multimedia2020】跨模态注意力Transformer模型的深度视频理解

【ACM Multimedia2020】跨模态注意力Transformer模型的深度视频理解

专知

15+阅读 · 2020年8月30日

【KDD2020-Tutorial】深度学习异常检测，180页ppt

【KDD2020-Tutorial】深度学习异常检测，180页ppt

专知

49+阅读 · 2020年8月28日

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

专知

13+阅读 · 2020年4月1日

一文详解深度学习在命名实体识别(NER)中的应用

一文详解深度学习在命名实体识别(NER)中的应用

AINLP

24+阅读 · 2018年10月23日

贝叶斯网分解理论及其应用

国家自然科学基金

9+阅读 · 2017年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

20+阅读 · 2015年12月31日

有效融合多源异构数据的集成分类器研究

国家自然科学基金

5+阅读 · 2015年12月31日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

材料与加工敏感的形状分析与建模

国家自然科学基金

0+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

10+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

反问题的数学建模、计算及应用

国家自然科学基金

2+阅读 · 2014年12月31日

基于融合先验知识的机器学习的多传感器融合研究

国家自然科学基金

16+阅读 · 2013年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

170+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

40+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

101+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

213+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

471+阅读 · 2023年3月31日

Nature Language Reasoning, A Survey

Arxiv

77+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

170+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

25+阅读 · 2023年1月13日

VIP会员

相关主题

牛津大学 (University of Oxford)

相关VIP内容

【剑桥大学博士论文】使用检索方法增强多模态问答系统

【剑桥大学博士论文】使用检索方法增强多模态问答系统

专知会员服务

36+阅读 · 2024年11月8日

【MIT博士论文】合成数据的视觉表示学习

【MIT博士论文】合成数据的视觉表示学习

专知会员服务

23+阅读 · 2024年8月25日

【伯克利博士论文】神经网络中的结构与表征

【伯克利博士论文】神经网络中的结构与表征

专知会员服务

47+阅读 · 2024年5月12日

【ETHZ博士论文】神经场景表示用于三维重建和场景理解

【ETHZ博士论文】神经场景表示用于三维重建和场景理解

专知会员服务

36+阅读 · 2024年3月15日

【ETHZ博士论文】在弱监督学习中施加和揭示群组结构

【ETHZ博士论文】在弱监督学习中施加和揭示群组结构

专知会员服务

21+阅读 · 2023年10月15日

【伯克利博士论文】现实世界机器人系统控制的鲁棒机器学习

【伯克利博士论文】现实世界机器人系统控制的鲁棒机器学习

专知会员服务

25+阅读 · 2023年5月21日

【UFPE大学博士论文】基于熵损失的鲁棒深度学习

【UFPE大学博士论文】基于熵损失的鲁棒深度学习

专知会员服务

42+阅读 · 2022年11月11日

【伯克利博士论文】学习跨领域的可迁移表示

【伯克利博士论文】学习跨领域的可迁移表示

专知会员服务

47+阅读 · 2022年8月17日

【索邦大学博士论文】实体与关系抽取中的泛化与上下文化

【索邦大学博士论文】实体与关系抽取中的泛化与上下文化

专知会员服务

31+阅读 · 2022年6月20日

深度学习如何用于基因学？新加坡国立Bresson教授《使用与图卷积网络学习解开基因组组装》，51页ppt

深度学习如何用于基因学？新加坡国立Bresson教授《使用与图卷积网络学习解开基因组组装》，51页ppt

专知会员服务

18+阅读 · 2022年6月6日

热门VIP内容

开通专知VIP会员享更多权益服务

训练扩散模型其实比你想象的更简单！何恺明团队新作Dispersive Loss：给扩散模型加正则化

【ICML2025】用于可扩展持续强化学习的自组合策略

最新4500字《死亡算法：人工智能如何助推对加沙的大规模杀戮》（附原文）

人工智能行业：2027年AI预测报告

相关资讯

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

37+阅读 · 2023年4月13日

数据受限条件下的多模态处理技术综述

数据受限条件下的多模态处理技术综述

专知

20+阅读 · 2022年7月16日

综述| 当图神经网络遇上强化学习

综述| 当图神经网络遇上强化学习

图与推荐

34+阅读 · 2022年7月1日

【AI与医学】多模态机器学习精准医疗健康

【AI与医学】多模态机器学习精准医疗健康

专知

17+阅读 · 2022年4月25日

「因果性机器学习」书册，88页pdf概述机器学习中的因果推理

「因果性机器学习」书册，88页pdf概述机器学习中的因果推理

专知

19+阅读 · 2021年3月21日

【KDD2020】动态知识图谱的多事件预测

【KDD2020】动态知识图谱的多事件预测

专知

88+阅读 · 2020年8月31日

【ACM Multimedia2020】跨模态注意力Transformer模型的深度视频理解

【ACM Multimedia2020】跨模态注意力Transformer模型的深度视频理解

专知

15+阅读 · 2020年8月30日

【KDD2020-Tutorial】深度学习异常检测，180页ppt

【KDD2020-Tutorial】深度学习异常检测，180页ppt

专知

49+阅读 · 2020年8月28日

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

专知

13+阅读 · 2020年4月1日

一文详解深度学习在命名实体识别(NER)中的应用

一文详解深度学习在命名实体识别(NER)中的应用

AINLP

24+阅读 · 2018年10月23日

相关基金

贝叶斯网分解理论及其应用

国家自然科学基金

9+阅读 · 2017年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

20+阅读 · 2015年12月31日

有效融合多源异构数据的集成分类器研究

国家自然科学基金

5+阅读 · 2015年12月31日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

材料与加工敏感的形状分析与建模

国家自然科学基金

0+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

10+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

反问题的数学建模、计算及应用

国家自然科学基金

2+阅读 · 2014年12月31日

基于融合先验知识的机器学习的多传感器融合研究

国家自然科学基金

16+阅读 · 2013年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

170+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

40+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

101+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

213+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

471+阅读 · 2023年3月31日

Nature Language Reasoning, A Survey

Arxiv

77+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

170+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

25+阅读 · 2023年1月13日

微信扫码咨询专知VIP会员