深度学习模型在包括计算机视觉、自然语言生成和语音处理在内的许多环境中展示了令人印象深刻的能力。然而,这些模型的一个重要缺点是它们通常需要在大型数据集上进行训练才能发挥最大效果。在医学等领域,大型数据集并不总是可用的,因此需要数据高效的模型,即使在有限的数据环境中也能表现良好。受这一需求的启发,本论文提出了四项对数据高效机器学习的贡献:(1)分析和改进小样本学习,我们研究了一种流行的小样本学习算法(模型不可知元学习)并提供了关于它为何有效的见解,提出了一个提供了显著计算优势的简化版本;(2)在小型临床心电图(ECG)数据集上改进监督学习,我们开发了一种新的ECG数据增强策略,有助于提高一系列预测问题的性能;(3)通过使用嵌套优化改进预训练,引入了一种高效的基于梯度的算法,以共同优化模型参数和预训练算法设计选择;(4)为复杂的临床时间序列开发了一种新的自监督学习流程,流程的设计受到现实世界临床时间序列数据的多模态、多维性质的驱动。统一这些贡献的是心血管医学的应用领域,这是一个机器学习有潜力改善患者护理和结果的设置。 https://dspace.mit.edu/handle/1721.1/153841