古代植物应如何分类？科学家引入拓扑学方法解决问题！

2017 年 7 月 17 日 中科院物理所 唐一尘

植物的故事与它们的叶子息息相关，长在湿冷环境的树木多会有带锯齿的大叶子，而长在干热地带的树木则会小儿平滑的树叶。

现在科学家已经罗列出了一个包含来自 141 个家族、75 个地点以及 182,000 种树叶的地图。利用这一地图，科学家能以 14.5% 的准确率从树叶的形状估计来源的地点，以 27.3% 的准确率预测来源的科属，远远比常规的方法准确。

图丨该地图能通过树叶形状预测来源地

这一方法能帮助我们探究环境是如何影响树叶形状的，并有望通过化石中的形状推断古代的气候状况。“这份数据意义重大，”贝勒大学的古植物学家 Dan Peppe 表示，“我们离重构古代气候和植物分类有进了一步。”

该研究结果被出版在 6 月 20 日的 bioRxiv 上，植物形态学家 Dan Chitwood 也在 2017 年 6 月 27 日的植物学大会上德州沃斯堡的植物学大会上发表了结果。

Chitwood 是密苏里州圣路易斯 Donald Danforth 植物科学中心的前科学家，他的团队为植物地图的绘制搜集了包括葡萄和番茄在内的植物种类数据，以及有关族群和地点的广泛分类表。

然后，团队使用了一种叫做持续同调（persistent homology）的拓扑学算法分析树叶形状。根据周围像素的密度，这一方法把赋予图片的每一个像素一个值，然后把树叶分成 16 份并分析这些数值出现的规律。最后，研究人员用这些数据绘制形状与地理位置在族群间的关系。

图丨持续同调（persistent homology）

Chitwood 的最终目标是重组树叶的“形态空间”，也就是所有可能形状所组成的集。“如果你能够测量地球上现在和过去所存在的所有树叶，结果会是随机的吗？”他问道，“会有从未出现过的形状吗？从未出现的原因是否是植物无法生长出这种形状？”

图丨对树叶形状的分析

持续同调在各方面有着广泛的应用，从神经网络分布到音乐乐句的结构，许多结构图像分析中都有它的影子。Chitwood 希望它也能为植物分析提供线索，其他科学家也有此意向。

维也纳大学的植物分类学家 Yannick Städler 也正用此方法分析花朵的 X 光图像，并希望这能克服传统方法的缺点——在常规的分类学方法中，科学家通常把重复出现的图像标记为节点，并分析规律。

图丨多种树叶的分布情况

Städler 表示，该常规手段在动物身上十分有用，因为动物身上有着诸如骨架、五官等明显的节点；但花朵通常有着顺滑而流畅的形态，所以我们很难做出标记。

包括 Peppe 在内的古植物学家一直在设法将树叶化石的分析过程自动化。目前，对节点的定位还需要科学家手动进行。

图丨对多样性和丰富性的分析

除了植物地图之外，还有许多项目致力于明晰植物的分类。比如，一个叫做 Pl@ntNet 的项目就通过用户上传手机 APP 的方式搜集了大量植物图片。法国农业国际发展研究中心（French Agricultural Research Centre for International Development）的植物学家 Pierre Bonnet 表示，目前通过机器学习，该项目已分析了 580,000 张来自 13,000 种植物的图片。

图丨Pl@ntNet的项目

Pl@ntNet 的研究者、法国自动化和计算机科学研究所（ Research in Computer Science and Automation）的 Alexis Joly 表示，该软件在辨识植物种类的方面比 Chitwood 的地图更胜一筹，但是 Pl@ntNet 还未开始研究树叶的形状。

Chitwood 希望把拓扑分析得到的结果应用到机器学习中去，看看这样能否增加其科属分类和地理位置预测的准确度。但他表示，自己对形状本身更感兴趣。

在很长一段时间内，科学家对植物的分类逐渐变得束手无策。然而，随着科学家对植物的细节特征投入更多的研究（特别是谷物）并开始探究基因和环境的影响，该领域正在经历复兴。

“分类学正在重生，” Städler 表示，“我认为通过对基因数据的研究，我们的未来一片光明。”

本文由微信公众号“DeepTech深科技”（ID：mit-tr）授权转载