尽管深度学习取得了显著的成就,但它仍是一个年轻的领域。就像许多科学学科的早期阶段一样,它的特点是发现新现象、临时的设计决策以及缺乏统一和组合性的数学基础。从实现反向传播的复杂性,到不断增长的神经网络架构动物园,再到新的、尚未被充分理解的现象,如双重下降、规模定律或上下文中学习,深度学习中很少有统一的原则。

本论文基于范畴论的语言,为深度学习开发了一种新的数学基础。我们开发了一个新框架,这个框架是a) 端到端的,b) 统一的,并且c) 不仅仅是描述性的,而且是规范性的,意味着它适合在具有足够特性的编程语言中直接实现。我们还系统化了许多现有的方法,将文献中许多现有的构造和概念归于同一体系下。 在第一部分,理论部分,我们识别并模型化了深度学习系统的两个主要属性:它们是参数化的和双向的。我们扩展了之前定义的actegories和Para的构造来研究前者,并定义加权光学来研究后者。结合它们产生了参数化加权光学,一种人工神经网络的范畴模型,以及更多:第一部分中的构造与许多其他类型的双向过程,如贝叶斯更新、值迭代和博弈论有着密切的联系。

第二部分证明了第一部分中的抽象,将它们应用于建模反向传播、架构和监督学习。我们提供了一个透镜理论公理化的微分,不仅覆盖平滑空间,还包括布尔电路的离散设置。我们调研现有的,并开发新的神经网络架构的范畴模型。我们形式化了优化器的概念,最后,将所有现有的概念结合起来,为监督学习提供了一个统一和组合性的框架。

成为VIP会员查看完整内容
56

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
【博士论文】神经语言模型的参数效率,199页pdf
专知会员服务
31+阅读 · 3月13日
【博士论文】元学习算法与应用,195页pdf
专知会员服务
54+阅读 · 3月10日
【博士论文】图神经网络算法推理,135页pdf
专知会员服务
44+阅读 · 2月23日
【NUS博士论文】深度表示学习的视频基础模型,236页pdf
专知会员服务
30+阅读 · 2023年12月26日
【MIT博士论文】数据高效强化学习,176页pdf
最新《图嵌入组合优化》综述论文,40页pdf
【KDD2020】图神经网络:基础与应用,322页ppt
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
26+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
15+阅读 · 2013年12月31日
Arxiv
158+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
408+阅读 · 2023年3月31日
Arxiv
147+阅读 · 2023年3月24日
Arxiv
21+阅读 · 2023年3月17日
Arxiv
10+阅读 · 2020年11月26日
VIP会员
相关基金
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
26+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
15+阅读 · 2013年12月31日
微信扫码咨询专知VIP会员