Previous work has argued that recursive numeral systems optimise the trade-off between lexicon size and average morphosyntatic complexity (Denić and Szymanik, 2024). However, showing that only natural-language-like systems optimise this tradeoff has proven elusive, and the existing solution has relied on ad-hoc constraints to rule out unnatural systems (Yang and Regier, 2025). Here, we argue that this issue arises because the proposed trade-off has neglected regularity, a crucial aspect of complexity central to human grammars in general. Drawing on the Minimum Description Length (MDL) approach, we propose that recursive numeral systems are better viewed as efficient with regard to their regularity and processing complexity. We show that our MDL-based measures of regularity and processing complexity better capture the key differences between attested, natural systems and unattested but possible ones, including "optimal" recursive numeral systems from previous work, and that the ad-hoc constraints from previous literature naturally follow from regularity. Our approach highlights the need to incorporate regularity across sets of forms in studies that attempt to measure and explain optimality in language.


翻译:先前的研究认为,递归数字系统在词汇库大小与平均形态句法复杂度之间实现了最优权衡(Denić 与 Szymanik,2024)。然而,证明仅类自然语言系统能够优化这一权衡一直难以实现,现有解决方案依赖于特定约束条件以排除非自然系统(Yang 与 Regier,2025)。本文认为,此问题源于所提出的权衡忽略了规律性——这是人类语法中复杂性的关键方面。借鉴最小描述长度(MDL)方法,我们提出递归数字系统应被视为在规律性与处理复杂度方面具有高效性。我们证明,基于 MDL 的规律性与处理复杂度度量能更好地捕捉已证实的自然系统与未证实但可能存在的系统(包括先前研究中的“最优”递归数字系统)之间的关键差异,且先前文献中的特定约束条件自然源于规律性。我们的方法强调,在试图测量和解释语言最优性的研究中,需要将形式集合的规律性纳入考量。

0
下载
关闭预览

相关内容

多模态基础模型的机制可解释性综述
专知会员服务
41+阅读 · 2月28日
【ICCV2023】保留模态结构改进多模态学习
专知会员服务
31+阅读 · 2023年8月28日
【CIKM2022】基于双向Transformers对比学习的序列推荐
专知会员服务
21+阅读 · 2022年8月10日
【CVPR2022】MSDN: 零样本学习的互语义蒸馏网络
专知会员服务
21+阅读 · 2022年3月8日
基于Lattice LSTM的命名实体识别
微信AI
48+阅读 · 2018年10月19日
LibRec 每周算法:LDA主题模型
LibRec智能推荐
29+阅读 · 2017年12月4日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
VIP会员
相关VIP内容
多模态基础模型的机制可解释性综述
专知会员服务
41+阅读 · 2月28日
【ICCV2023】保留模态结构改进多模态学习
专知会员服务
31+阅读 · 2023年8月28日
【CIKM2022】基于双向Transformers对比学习的序列推荐
专知会员服务
21+阅读 · 2022年8月10日
【CVPR2022】MSDN: 零样本学习的互语义蒸馏网络
专知会员服务
21+阅读 · 2022年3月8日
相关资讯
基于Lattice LSTM的命名实体识别
微信AI
48+阅读 · 2018年10月19日
LibRec 每周算法:LDA主题模型
LibRec智能推荐
29+阅读 · 2017年12月4日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员