机器学习近期的实质性进展主要源于序列模型的突破,这些模型构成了在科学应用中取得广泛成功的深度学习模型的骨干。然而,现有的方法需要对不同任务、模态和能力进行广泛的专门化;存在计算效率瓶颈;并且在对更复杂的序列数据建模时,例如涉及长期依赖性时,会遇到困难。因此,继续开发用于建模一般序列的原则性和实用的方法仍然至关重要。这篇论文开发了一种使用状态空间模型进行深度序列建模的新方法,这种方法理论上有根据,计算效率高,并在各种数据模态和应用中取得了强大的结果。首先,我们介绍了一类具有众多表示和属性的模型,这些模型概括了标准深度序列模型(如循环神经网络和卷积神经网络)的优点。然而,我们发现这些模型的计算可能具有挑战性,并开发了新的结构化状态空间类别,这些状态空间在现代硬件上非常快,无论是在扩展到长序列还是在诸如自回归推断等其他设置中。最后,我们提出了一个新的数学框架,用于增量建模连续信号,可以与状态空间模型结合,赋予它们原则性的状态表示,并提高它们对长距离依赖性的建模能力。总的来说,这新的方法类别为机器学习模型提供了有效和多功能的构建块,特别是针对大规模的通用序列数据的处理。

深度学习方法在机器学习和人工智能领域取得了显著进步,在科学和工业应用中获得了广泛的成功。序列模型是核心类别的模型,它们是作用于任意输入序列的参数化映射。这些模型可以应用于各种复杂的序列数据处理任务,包括自然语言理解、语音和音频、时间序列分析,甚至可以转化为序列的间接模态,如图像 [194, 148, 18, 94, 51]。

成为VIP会员查看完整内容
43

相关内容

斯坦福大学(StanfordUniversity)位于加利福尼亚州,临近旧金山,占地35平方公里,是美国面积第二大的大学。它被公认为世界上最杰出的大学之一,相比美国东部的常春藤盟校,特别是哈佛大学、耶鲁大学,斯坦福大学虽然历史较短,但无论是学术水准还是其他方面都能与常春藤名校相抗衡。斯坦福大学企业管理研究所和法学院在美国是数一数二的,美国最高法院的9个大法官,有6个是从斯坦福大学的法学院毕业的。
【普林斯顿博士论文】神经符号机器学习推理,133页pdf
专知会员服务
46+阅读 · 2023年2月1日
【伯克利博士论文】学习在动态环境中泛化,103页pdf
专知会员服务
71+阅读 · 2022年10月12日
【斯坦福博士论文】具有学习约束的深度表示,239页pdf
专知会员服务
61+阅读 · 2022年9月13日
【ETH博士论文】贝叶斯深度学习,241页pdf
专知会员服务
125+阅读 · 2022年1月16日
专知会员服务
71+阅读 · 2021年7月29日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
15+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
157+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
398+阅读 · 2023年3月31日
Arxiv
66+阅读 · 2023年3月26日
Arxiv
139+阅读 · 2023年3月24日
VIP会员
相关基金
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
15+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员