We demonstrate that the assembly pathway method underlying ``Assembly Theory" (AT) is a suboptimal restricted version of Huffman's encoding (Shannon-Fano type) for `counting copies,' the stated objective of the authors of AT, introduced in computer science in the 1960s and widely used by popular statistical and computable compression algorithms that have been applied to all sort of biosignatures before. We show how simple modular instructions can mislead AT, leading to failure to accomplish what the authors originally intended (counting the `number of copies') or to capture subtleties, beyond very trivial statistical properties of biological systems. We present cases whose low complexity can arbitrarily diverge from the random-like appearance to which the AT would assign arbitrarily high statistical significance, and show that it fails in simple cases (synthetic or natural) which the assembly theory was supposed to shed some light on. Our theoretical and empirical results imply that the assembly index, whose computable nature is not an advantage, does not offer any substantial improvement over existing concepts and methods, computable or (semi) uncomputable. No strong compression or algorithmic complexity results were required to prove that AT and MA are ill-defined and under-perform as compared to simple coding schemes. We show that despite the claims of experimental data, the assembly measure is driven mostly or only by InChI codes which had already been reported before to discriminate organic from inorganic compounds by other indexes.


翻译:我们展示了支撑“组装理论” (AT) 的组装路径方法在“统计拷贝”中是霍夫曼编码 (Shannon-Fano类型) 的一种次优限制版本。AT 的作者旨在统计“拷贝数量”,并在20世纪60年代引入计算机科学中,在此之后广泛应用于各种生物标记。我们展示了AT如何受简单模块化指令的影响,导致未能实现作者最初的意图(计算“拷贝数量”),也无法捕捉生物系统的微妙之处。我们展示了一些案例,它们的低复杂度可以任意与AT赋予任意高的统计显着性的随机外观不同,而且我们展示了在AT本应阐明的简单情况下(合成或天然情况下)它的失败。我们的理论和实证研究结论表明,计算性质是AT并没有比现有的计算或(半)不可计算的概念和方法提供任何实质性改进。我们展示了尽管实验数据声称,组装测量主要或只受到原子间符号化标识(InChI代码)的驱动,但它也受到其他指数的影响,这些指数早已被报告可以通过其他索引将有机化合物与无机化合物加以区分。

0
下载
关闭预览

相关内容

【经典书】主动学习理论,226页pdf,Theory of Active Learning
专知会员服务
125+阅读 · 2021年7月14日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
GNN 新基准!Long Range Graph Benchmark
图与推荐
0+阅读 · 2022年10月18日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
28+阅读 · 2019年5月18日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
vae 相关论文 表示学习 1
CreateAMind
12+阅读 · 2018年9月6日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
19+阅读 · 2022年7月29日
Arxiv
57+阅读 · 2022年1月5日
A Comprehensive Survey on Transfer Learning
Arxiv
121+阅读 · 2019年11月7日
VIP会员
相关VIP内容
【经典书】主动学习理论,226页pdf,Theory of Active Learning
专知会员服务
125+阅读 · 2021年7月14日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
相关资讯
GNN 新基准!Long Range Graph Benchmark
图与推荐
0+阅读 · 2022年10月18日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
28+阅读 · 2019年5月18日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
vae 相关论文 表示学习 1
CreateAMind
12+阅读 · 2018年9月6日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员