主题: Effective Linear Models for Learning with Sequences and Time Series
摘要: 在这篇演讲中,演讲者介绍了他的研究小组在开发用于序列和时间序列数据的分类和回归任务的机器学习算法方面所做的一些工作。重点是训练线性模型的算法。尽管这些线性模型被认为过于简单,无法在许多学习任务中实现高精度,但当在丰富的特征空间中进行训练时,它们是非常复杂的模型(如集成和深度学习模型)的有力竞争对手。具有丰富特征的线性模型与复杂的非线性模型一样精确,但训练效率高,易于解释。这种情况下的可解释性意味着模型(加权特征列表)和预测(特征权重之和)对用户是透明的。他首先概述了他们遇到序列和时间序列的重要和广泛的应用领域,讨论了使用序列学习的常用方法,并提出了序列分类和回归任务的算法。他还展示了序列学习的思想如何自然地传递给时间序列数据,并展示了一个从多个符号表示中选择特征的线性模型,实现了最先进的时间序列分类精度。通过组合序列数据的多种表示形式来创建丰富的特征,使得线性模型能够获得高精度、高效的训练和保持可解释性,后者是许多应用中的一个关键要求。
邀请嘉宾: Georgiana Ifrim博士是都柏林大学学院计算机科学学院的助理教授,是SFI机器学习研究培训中心(ML Labs)的联合负责人,同时也是SFI资助的Insight Centre for Data Analytics和VistaMilk Research centres的调查员。她是加州大学计算机科学学院的研究生研究主任。 个人主页:https://people.ucd.ie/georgiana.ifrim