本论文提出了一种使用状态空间模型的深度序列建模新方法,这是一种理论上扎实、计算上高效并在各种数据模态和应用中均取得强大结果的灵活方法。首先,我们引入了一类具有多种表现形式和属性的模型,它们概括了标准深度序列模型(如递归神经网络和卷积神经网络)的优点。然而,我们展示了计算这些模型可能具有挑战性,并开发了新类别的结构化状态空间,它们在现代硬件上非常快速,无论是扩展到长序列,还是在其他设置(如自回归推理)中。最后,我们提出了一个用于增量建模连续信号的新数学框架,它可以与状态空间模型结合,赋予它们原理性的状态表征,并提高它们建模长程依赖的能力。综合来看,这个新类别的方法为机器学习模型提供了有效和多功能的构建模块,特别是在处理大规模一般序列数据方面。

深度学习方法在机器学习和人工智能领域取得了重大进展,并在科学和工业应用中广泛成功。核心的一类模型是序列模型,这些模型是对任意序列输入进行操作的参数化映射。这些模型可以应用于各种复杂的序列数据处理任务,包括自然语言理解、语音和音频、时间序列分析,甚至可以将之视为序列的间接模态,如图像[194, 148, 18, 94, 51]。

成为VIP会员查看完整内容
36

相关内容

斯坦福大学(StanfordUniversity)位于加利福尼亚州,临近旧金山,占地35平方公里,是美国面积第二大的大学。它被公认为世界上最杰出的大学之一,相比美国东部的常春藤盟校,特别是哈佛大学、耶鲁大学,斯坦福大学虽然历史较短,但无论是学术水准还是其他方面都能与常春藤名校相抗衡。斯坦福大学企业管理研究所和法学院在美国是数一数二的,美国最高法院的9个大法官,有6个是从斯坦福大学的法学院毕业的。
【伯克利博士论文】可迁移生成模型,137页pdf
专知会员服务
53+阅读 · 2023年5月23日
【匹兹堡大学博士论文】数据限制下的因果推理,147页pdf
【爱丁堡大学博士论文】图聚类结构的学习,164页pdf
专知会员服务
19+阅读 · 2023年1月5日
【MIT博士论文】非参数因果推理的算法方法,424页pdf
专知会员服务
82+阅读 · 2022年9月20日
【斯坦福博士论文】用于系统设计的图算法,130页pdf
专知会员服务
38+阅读 · 2022年8月22日
专知会员服务
34+阅读 · 2021年7月19日
深度多模态表示学习综述论文,22页pdf
专知
30+阅读 · 2020年6月21日
【新书册】贝叶斯神经网络,41页pdf
专知
27+阅读 · 2020年6月3日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
Arxiv
158+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
408+阅读 · 2023年3月31日
Arxiv
68+阅读 · 2023年3月26日
Arxiv
147+阅读 · 2023年3月24日
Arxiv
21+阅读 · 2023年3月17日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
微信扫码咨询专知VIP会员