【牛津大学博士论文】基于元学习和对称性的数据高效深度学习探索 - 专知VIP

会员服务 ·

20

牛津大学 (University of Oxford) · 元学习 · 深度学习 · 条件神经过程 ·

2024 年 10 月 27 日

【牛津大学博士论文】基于元学习和对称性的数据高效深度学习探索

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

近年来，深度学习的进展在很大程度上得益于数据和计算资源的增加。尽管数据的丰富性使模型在某些领域表现良好，但在实际应用中（例如医学领域），数据往往稀缺或难以收集。此外，也存在将大型数据集视为许多相关的小数据集的情境，其中一个小数据集相关任务的数据可能不充足。同时，人类智能通常只需少量样本即可在新任务上表现出色，这强调了设计数据高效AI系统的重要性。本论文探讨了应对这一挑战的两种策略：元学习和对称性。

元学习将数据丰富的环境视为许多小型、独立数据集的集合。每个小数据集代表一个不同的任务，但它们之间存在潜在的共享知识。利用这种共享知识可以设计出在相似领域中高效解决新任务的学习算法。相比之下，对称性是一种直接的先验知识。通过确保模型的预测在输入发生任何变换后仍保持一致，这些模型可以提高样本效率和泛化能力。

在后续章节中，我们提出了一些旨在提高深度学习系统数据效率的新技术和模型。首先，我们展示了基于条件神经过程（CNPs）的编码器-解码器风格的元学习方法的成功应用。其次，我们引入了一类新型的表达力强的元学习随机过程模型，这些模型通过在函数空间中堆叠神经参数化的马尔可夫转移算子序列构建而成。最后，我们提出了群等变子采样/上采样层，以解决传统子采样/上采样层中等变性的丧失问题。利用这些层可以构建端到端的等变模型，从而提升数据效率。

https://ora.ox.ac.uk/objects/uuid:98de960f-f7eb-4437-8c37-174b82374b21

成为VIP会员查看完整内容

28

相关内容

牛津大学 (University of Oxford)

牛津大学 (University of Oxford)

牛津大学是一所英国研究型大学，也是罗素大学集团、英国“G5超级精英大学”，欧洲顶尖大学科英布拉集团、欧洲研究型大学联盟的核心成员。牛津大学培养了众多社会名人，包括了27位英国首相、60位诺贝尔奖得主以及数十位世界各国的皇室成员和政治领袖。2016年9月，泰晤士高等教育发布了2016-2017年度世界大学排名，其中牛津大学排名第一。

【斯坦福博士论文】超越最大似然估计：分布感知的机器学习

【斯坦福博士论文】超越最大似然估计：分布感知的机器学习

专知会员服务

27+阅读 · 2024年9月21日

【MIT博士论文】非线性优化在机器学习应用中的平滑性与自适应性

【MIT博士论文】非线性优化在机器学习应用中的平滑性与自适应性

专知会员服务

25+阅读 · 2024年8月27日

【MIT博士论文】大规模机器学习算法：效率、估计误差及其拓展

【MIT博士论文】大规模机器学习算法：效率、估计误差及其拓展

专知会员服务

28+阅读 · 2024年8月3日

【CMU博士论文】鲁棒机器学习：在分布变化下的检测、评估和适应

【CMU博士论文】鲁棒机器学习：在分布变化下的检测、评估和适应

专知会员服务

25+阅读 · 2024年7月2日

【ETHZ博士论文】有限数据中的元学习先验：从理论到实践

【ETHZ博士论文】有限数据中的元学习先验：从理论到实践

专知会员服务

38+阅读 · 2024年6月4日

【剑桥大学博士论文】使用机器学习的因果推断中的两个问题的半参数方法

【剑桥大学博士论文】使用机器学习的因果推断中的两个问题的半参数方法

专知会员服务

26+阅读 · 2024年5月25日

【CMU博士论文】高效的深度神经网络终身学习：架构、训练和数据的优化

【CMU博士论文】高效的深度神经网络终身学习：架构、训练和数据的优化

专知会员服务

41+阅读 · 2024年4月24日

【斯坦福博士论文】合作博弈论在可解释机器学习中的应用

【斯坦福博士论文】合作博弈论在可解释机器学习中的应用

专知会员服务

44+阅读 · 2023年9月19日

【斯坦福博士论文】利用离线数据构建多功能强化学习智能体

【斯坦福博士论文】利用离线数据构建多功能强化学习智能体

专知会员服务

48+阅读 · 2022年9月14日

【伯克利Guanhua Wang博士论文】分布式机器学习系统的颠覆性研究

【伯克利Guanhua Wang博士论文】分布式机器学习系统的颠覆性研究

专知会员服务

49+阅读 · 2022年5月17日

【经典书】图数据挖掘算法，安全性及应用，256页pdf

【经典书】图数据挖掘算法，安全性及应用，256页pdf

专知

17+阅读 · 2022年8月22日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知

18+阅读 · 2022年7月11日

NLP如何用元学习？李宏毅老师NAACL2022最新《元学习自然语言处理》综述论文阐述最新研究进展

NLP如何用元学习？李宏毅老师NAACL2022最新《元学习自然语言处理》综述论文阐述最新研究进展

专知

24+阅读 · 2022年5月4日

【AI与医学】多模态机器学习精准医疗健康

【AI与医学】多模态机器学习精准医疗健康

专知

17+阅读 · 2022年4月25日

【ICLR2022】图神经网络复杂时间序列建模以及医疗健康应用

【ICLR2022】图神经网络复杂时间序列建模以及医疗健康应用

专知

10+阅读 · 2022年4月15日

【博士论文】多任务学习视觉场景理解，140页pdf

【博士论文】多任务学习视觉场景理解，140页pdf

专知

28+阅读 · 2022年4月5日

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

专知

17+阅读 · 2021年1月24日

【ICML2020-南大周志华老师组】针对未见类未标记数据的安全深度半监督学习

【ICML2020-南大周志华老师组】针对未见类未标记数据的安全深度半监督学习

专知

46+阅读 · 2020年7月5日

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

专知

16+阅读 · 2020年4月27日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

77+阅读 · 2019年10月20日

基于学习的智能化漏洞挖掘关键技术研究

国家自然科学基金

6+阅读 · 2017年12月31日

面向海量高维数据的可深度结合的贝叶斯网学习与推理新方法研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

机会物联网基于命名数据网络的信息检索机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

29+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

面向地理模型集成与运行的数据适配方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

Statistical inference for mean-field queueing systems

Arxiv

0+阅读 · 2024年11月20日

Hypergraph $p$-Laplacian equations for data interpolation and semi-supervised learning

Arxiv

0+阅读 · 2024年11月19日

Bayesian multilevel compositional data analysis with the R package multilevelcoda

Arxiv

0+阅读 · 2024年11月19日

Closed-loop multi-step planning with innate physics knowledge

Arxiv

0+阅读 · 2024年11月18日

Physics-informed neural networks (PINNs) for numerical model error approximation and superresolution

Arxiv

0+阅读 · 2024年11月14日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

174+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

106+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

223+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

Data-centric Artificial Intelligence: A Survey

Arxiv

25+阅读 · 2023年3月17日

VIP会员

相关主题

牛津大学 (University of Oxford)

条件神经过程

相关VIP内容

【斯坦福博士论文】超越最大似然估计：分布感知的机器学习

【斯坦福博士论文】超越最大似然估计：分布感知的机器学习

专知会员服务

27+阅读 · 2024年9月21日

【MIT博士论文】非线性优化在机器学习应用中的平滑性与自适应性

【MIT博士论文】非线性优化在机器学习应用中的平滑性与自适应性

专知会员服务

25+阅读 · 2024年8月27日

【MIT博士论文】大规模机器学习算法：效率、估计误差及其拓展

【MIT博士论文】大规模机器学习算法：效率、估计误差及其拓展

专知会员服务

28+阅读 · 2024年8月3日

【CMU博士论文】鲁棒机器学习：在分布变化下的检测、评估和适应

【CMU博士论文】鲁棒机器学习：在分布变化下的检测、评估和适应

专知会员服务

25+阅读 · 2024年7月2日

【ETHZ博士论文】有限数据中的元学习先验：从理论到实践

【ETHZ博士论文】有限数据中的元学习先验：从理论到实践

专知会员服务

38+阅读 · 2024年6月4日

【剑桥大学博士论文】使用机器学习的因果推断中的两个问题的半参数方法

【剑桥大学博士论文】使用机器学习的因果推断中的两个问题的半参数方法

专知会员服务

26+阅读 · 2024年5月25日

【CMU博士论文】高效的深度神经网络终身学习：架构、训练和数据的优化

【CMU博士论文】高效的深度神经网络终身学习：架构、训练和数据的优化

专知会员服务

41+阅读 · 2024年4月24日

【斯坦福博士论文】合作博弈论在可解释机器学习中的应用

【斯坦福博士论文】合作博弈论在可解释机器学习中的应用

专知会员服务

44+阅读 · 2023年9月19日

【斯坦福博士论文】利用离线数据构建多功能强化学习智能体

【斯坦福博士论文】利用离线数据构建多功能强化学习智能体

专知会员服务

48+阅读 · 2022年9月14日

【伯克利Guanhua Wang博士论文】分布式机器学习系统的颠覆性研究

【伯克利Guanhua Wang博士论文】分布式机器学习系统的颠覆性研究

专知会员服务

49+阅读 · 2022年5月17日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】基础模型训练中网络规模数据的负责任与高效使用

《俄乌战争背景下俄罗斯的战略性海军分析（2022-2025年）》最新100页报告

人工智能时代背景下的未来海战

相关资讯

【经典书】图数据挖掘算法，安全性及应用，256页pdf

【经典书】图数据挖掘算法，安全性及应用，256页pdf

专知

17+阅读 · 2022年8月22日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知

18+阅读 · 2022年7月11日

NLP如何用元学习？李宏毅老师NAACL2022最新《元学习自然语言处理》综述论文阐述最新研究进展

NLP如何用元学习？李宏毅老师NAACL2022最新《元学习自然语言处理》综述论文阐述最新研究进展

专知

24+阅读 · 2022年5月4日

【AI与医学】多模态机器学习精准医疗健康

【AI与医学】多模态机器学习精准医疗健康

专知

17+阅读 · 2022年4月25日

【ICLR2022】图神经网络复杂时间序列建模以及医疗健康应用

【ICLR2022】图神经网络复杂时间序列建模以及医疗健康应用

专知

10+阅读 · 2022年4月15日

【博士论文】多任务学习视觉场景理解，140页pdf

【博士论文】多任务学习视觉场景理解，140页pdf

专知

28+阅读 · 2022年4月5日

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

专知

17+阅读 · 2021年1月24日

【ICML2020-南大周志华老师组】针对未见类未标记数据的安全深度半监督学习

【ICML2020-南大周志华老师组】针对未见类未标记数据的安全深度半监督学习

专知

46+阅读 · 2020年7月5日

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

专知

16+阅读 · 2020年4月27日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

77+阅读 · 2019年10月20日

相关基金

基于学习的智能化漏洞挖掘关键技术研究

国家自然科学基金

6+阅读 · 2017年12月31日

面向海量高维数据的可深度结合的贝叶斯网学习与推理新方法研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

机会物联网基于命名数据网络的信息检索机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

29+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

面向地理模型集成与运行的数据适配方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

相关论文

Statistical inference for mean-field queueing systems

Arxiv

0+阅读 · 2024年11月20日

Hypergraph $p$-Laplacian equations for data interpolation and semi-supervised learning

Arxiv

0+阅读 · 2024年11月19日

Bayesian multilevel compositional data analysis with the R package multilevelcoda

Arxiv

0+阅读 · 2024年11月19日

Closed-loop multi-step planning with innate physics knowledge

Arxiv

0+阅读 · 2024年11月18日

Physics-informed neural networks (PINNs) for numerical model error approximation and superresolution

Arxiv

0+阅读 · 2024年11月14日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

174+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

106+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

223+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

Data-centric Artificial Intelligence: A Survey

Arxiv

25+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员