Existing machine learning frameworks operate over the field of real numbers ($\mathbb{R}$) and learn representations in real (Euclidean or Hilbert) vector spaces (e.g., $\mathbb{R}^d$). Their underlying geometric properties align well with intuitive concepts such as linear separability, minimum enclosing balls, and subspace projection; and basic calculus provides a toolbox for learning through gradient-based optimization. But is this the only possible choice? In this paper, we study the suitability of a radically different field as an alternative to $\mathbb{R}$ -- the ultrametric and non-archimedean space of $p$-adic numbers, $\mathbb{Q}_p$. The hierarchical structure of the $p$-adics and their interpretation as infinite strings make them an appealing tool for code theory and hierarchical representation learning. Our exploratory theoretical work establishes the building blocks for classification, regression, and representation learning with the $p$-adics, providing learning models and algorithms. We illustrate how simple Quillian semantic networks can be represented as a compact $p$-adic linear network, a construction which is not possible with the field of reals. We finish by discussing open problems and opportunities for future research enabled by this new framework.


翻译:现有的机器学习框架均在实数域($\mathbb{R}$)上运行,并在实(欧几里得或希尔伯特)向量空间(例如$\mathbb{R}^d$)中学习表示。其底层几何性质与线性可分性、最小包围球和子空间投影等直观概念高度契合;基础微积分为基于梯度的优化学习提供了工具箱。但这是唯一可能的选择吗?本文研究一种截然不同的域作为$\mathbb{R}$的替代方案的适用性——即具有超度量与非阿基米德性质的p进数空间$\mathbb{Q}_p$。p进数的层次结构及其作为无限字符串的诠释,使其成为编码理论与层次表示学习的有力工具。我们的探索性理论研究建立了基于p进数的分类、回归与表示学习的基础模块,提供了相应的学习模型与算法。我们阐释了简单的奎利安语义网络如何表示为紧凑的p进数线性网络——这一构造在实数域中是无法实现的。最后,我们讨论了这一新框架所开启的开放性问题与未来研究方向。

0
下载
关闭预览

相关内容

【ICML2022】闭式同构变换的时间序列对齐
专知会员服务
12+阅读 · 2022年6月20日
【CVPR2022】MSDN: 零样本学习的互语义蒸馏网络
专知会员服务
21+阅读 · 2022年3月8日
【NeurIPS 2021】学会学习图拓扑
专知会员服务
25+阅读 · 2021年10月22日
图节点嵌入(Node Embeddings)概述,9页pdf
专知
15+阅读 · 2020年8月22日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Arxiv
0+阅读 · 12月22日
VIP会员
相关VIP内容
【ICML2022】闭式同构变换的时间序列对齐
专知会员服务
12+阅读 · 2022年6月20日
【CVPR2022】MSDN: 零样本学习的互语义蒸馏网络
专知会员服务
21+阅读 · 2022年3月8日
【NeurIPS 2021】学会学习图拓扑
专知会员服务
25+阅读 · 2021年10月22日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员