利用有限的数据进行学习是深度学习的最大问题之一。目前,解决这个问题的流行方法是在大量数据上训练模型,无论是否标记,然后在同一模态的感兴趣的较小数据集上重新训练模型。直观地说,这种技术允许模型首先学习某种数据(如图像)的一般表示。然后,学习这种特定模态的特定任务应该需要更少的数据。虽然这种被称为“迁移学习”的方法在计算机视觉或自然语言处理等领域非常有效,但它不能解决深度学习的常见问题,如模型可解释性或对数据的总体需求。本文探索了在数据约束设置中学习表达模型问题的不同答案。我们不再依赖大数据集来学习神经网络的参数,而是用反映数据结构的已知函数来代替其中的一些参数。这些函数通常都是从内核方法的丰富文献中提取出来的。实际上,许多核函数都可以解释,并且/或允许使用少量数据进行学习。所提出方法属于"归纳偏差"的范畴,可以定义为对手头数据的假设,限制了学习过程中模型探索的空间。在本文的前两章中,我们在序列(如自然语言中的句子或蛋白质序列)和图(如分子)的上下文中证明了该方法的有效性。本文还强调了工作与深度学习最新进展之间的关系。本文的最后一章重点研究凸机器学习模型。这里,我们不是提出新的模型,而是想知道学习一个“好的”模型真正需要数据集中的哪些样本比例。更准确地说,研究了安全样本筛选的问题,即在拟合机器学习模型之前,执行简单测试以丢弃数据集中没有信息的样本,而不影响最优模型。此类技术可用于压缩数据集或挖掘稀有样本。

成为VIP会员查看完整内容
38

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
【2023新书】机器学习中的表示学习,101页pdf
专知会员服务
126+阅读 · 2023年2月3日
【UIUC博士论文】机器学习药物发现,109页pdf
专知会员服务
35+阅读 · 2023年1月12日
【伯克利博士论文】可信赖机器学习,227页pdf
专知会员服务
87+阅读 · 2022年12月12日
【牛津大学博士论文】关系数据的学习和推理,243页pdf
专知会员服务
53+阅读 · 2022年11月16日
【牛津大学博士论文】多模态自监督学习,172页pdf
专知会员服务
134+阅读 · 2022年10月4日
【MIT博士论文】实用机器学习的高效鲁棒算法,142页pdf
专知会员服务
56+阅读 · 2022年9月7日
自然语言处理现代方法,176页pdf
专知会员服务
267+阅读 · 2021年2月22日
最新《神经数据压缩导论》综述
专知
4+阅读 · 2022年7月19日
【MIT博士论文】数据高效强化学习,176页pdf
国家自然科学基金
16+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
7+阅读 · 2013年12月31日
国家自然科学基金
8+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2023年4月7日
Arxiv
14+阅读 · 2022年8月25日
Recent advances in deep learning theory
Arxiv
50+阅读 · 2020年12月20日
VIP会员
相关VIP内容
【2023新书】机器学习中的表示学习,101页pdf
专知会员服务
126+阅读 · 2023年2月3日
【UIUC博士论文】机器学习药物发现,109页pdf
专知会员服务
35+阅读 · 2023年1月12日
【伯克利博士论文】可信赖机器学习,227页pdf
专知会员服务
87+阅读 · 2022年12月12日
【牛津大学博士论文】关系数据的学习和推理,243页pdf
专知会员服务
53+阅读 · 2022年11月16日
【牛津大学博士论文】多模态自监督学习,172页pdf
专知会员服务
134+阅读 · 2022年10月4日
【MIT博士论文】实用机器学习的高效鲁棒算法,142页pdf
专知会员服务
56+阅读 · 2022年9月7日
自然语言处理现代方法,176页pdf
专知会员服务
267+阅读 · 2021年2月22日
相关基金
国家自然科学基金
16+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
7+阅读 · 2013年12月31日
国家自然科学基金
8+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员