古代植物应如何分类?科学家引入拓扑学方法解决问题!

2017 年 7 月 17 日 中科院物理所 唐一尘

植物的故事与它们的叶子息息相关,长在湿冷环境的树木多会有带锯齿的大叶子,而长在干热地带的树木则会小儿平滑的树叶。



现在科学家已经罗列出了一个包含来自 141 个家族、75 个地点以及 182,000 种树叶的地图。利用这一地图,科学家能以 14.5% 的准确率从树叶的形状估计来源的地点,以 27.3% 的准确率预测来源的科属,远远比常规的方法准确。


图丨该地图能通过树叶形状预测来源地


这一方法能帮助我们探究环境是如何影响树叶形状的,并有望通过化石中的形状推断古代的气候状况。“这份数据意义重大,”贝勒大学的古植物学家 Dan Peppe 表示,“我们离重构古代气候和植物分类有进了一步。”


该研究结果被出版在 6 月 20 日的 bioRxiv 上,植物形态学家 Dan Chitwood 也在 2017 年 6 月 27 日的植物学大会上德州沃斯堡的植物学大会上发表了结果。


Chitwood 是密苏里州圣路易斯 Donald Danforth 植物科学中心的前科学家,他的团队为植物地图的绘制搜集了包括葡萄和番茄在内的植物种类数据,以及有关族群和地点的广泛分类表。


然后,团队使用了一种叫做持续同调(persistent homology)的拓扑学算法分析树叶形状。根据周围像素的密度,这一方法把赋予图片的每一个像素一个值,然后把树叶分成 16 份并分析这些数值出现的规律。最后,研究人员用这些数据绘制形状与地理位置在族群间的关系。


图丨持续同调(persistent homology)


Chitwood 的最终目标是重组树叶的“形态空间”,也就是所有可能形状所组成的集。“如果你能够测量地球上现在和过去所存在的所有树叶,结果会是随机的吗?”他问道,“会有从未出现过的形状吗?从未出现的原因是否是植物无法生长出这种形状?”


图丨对树叶形状的分析


持续同调在各方面有着广泛的应用,从神经网络分布到音乐乐句的结构,许多结构图像分析中都有它的影子。Chitwood 希望它也能为植物分析提供线索,其他科学家也有此意向。


维也纳大学的植物分类学家 Yannick Städler 也正用此方法分析花朵的 X 光图像,并希望这能克服传统方法的缺点——在常规的分类学方法中,科学家通常把重复出现的图像标记为节点,并分析规律。


图丨多种树叶的分布情况


Städler 表示,该常规手段在动物身上十分有用,因为动物身上有着诸如骨架、五官等明显的节点;但花朵通常有着顺滑而流畅的形态,所以我们很难做出标记。


包括 Peppe 在内的古植物学家一直在设法将树叶化石的分析过程自动化。目前,对节点的定位还需要科学家手动进行。


图丨对多样性和丰富性的分析


除了植物地图之外,还有许多项目致力于明晰植物的分类。比如,一个叫做 Pl@ntNet 的项目就通过用户上传手机 APP 的方式搜集了大量植物图片。法国农业国际发展研究中心(French Agricultural Research Centre for International Development)的植物学家 Pierre Bonnet 表示,目前通过机器学习,该项目已分析了 580,000 张来自 13,000 种植物的图片。

图丨Pl@ntNet的项目


Pl@ntNet 的研究者、法国自动化和计算机科学研究所( Research in Computer Science and Automation)的 Alexis Joly 表示,该软件在辨识植物种类的方面比 Chitwood 的地图更胜一筹,但是 Pl@ntNet 还未开始研究树叶的形状。


Chitwood 希望把拓扑分析得到的结果应用到机器学习中去,看看这样能否增加其科属分类和地理位置预测的准确度。但他表示,自己对形状本身更感兴趣。


在很长一段时间内,科学家对植物的分类逐渐变得束手无策。然而,随着科学家对植物的细节特征投入更多的研究(特别是谷物)并开始探究基因和环境的影响,该领域正在经历复兴。


“分类学正在重生,” Städler 表示,“我认为通过对基因数据的研究,我们的未来一片光明。”


本文由微信公众号“DeepTech深科技”(ID:mit-tr)授权转载

编辑:Lixy


近期热门文章Top10

↓ 点击标题即可查看 ↓

1. 数学系和物理系的学生有什么差别?

2. 近85%的跑步者因跑步而受伤,你进行的慢跑真的对身体有好处吗?| SciFM Vol.08

3. 西瓜必须死,就在这个夏天

4. 再次颠覆认知!看完这些图,你才真正知道人类有多么渺小

5. 爱因斯坦曾经认为不可能的事情,天文学家刚刚做到了

6. 这又是一篇十分正经的招生宣传,不过聊的是国科大……

7. 超算界祁同伟,谷歌要让全世界向量子霸权低头

8. 描述混乱程度的物理量?熵究竟是个什么鬼?

9. 孩子,有时候并不是生活欺骗了你,而是你可能还不懂概率统计……

10. 科学史上最伟大的十位单身男科学家

点此查看以往全部热门文章


登录查看更多
0

相关内容

最新《生成式对抗网络》简介,25页ppt
专知会员服务
168+阅读 · 2020年6月28日
【论文扩展】欧洲语言网格:概述
专知会员服务
6+阅读 · 2020年3月31日
注意力图神经网络的多标签文本分类
专知会员服务
111+阅读 · 2020年3月28日
【图神经网络(GNN)结构化数据分析】
专知会员服务
114+阅读 · 2020年3月22日
自回归模型:PixelCNN
专知会员服务
25+阅读 · 2020年3月21日
【学科交叉】抗生素发现的深度学习方法
专知会员服务
23+阅读 · 2020年2月23日
【干货51页PPT】深度学习理论理解探索
专知会员服务
60+阅读 · 2019年12月24日
Deep-CEE:AI深度学习工具,帮助天文学家探索深空
深度学习探索
5+阅读 · 2019年7月21日
如何优化你的图像分类模型效果?
AI研习社
4+阅读 · 2019年5月26日
教程帖:如何解决90%的NLP问题(上)
论智
3+阅读 · 2018年2月12日
语义分割中的深度学习方法全解:从FCN、SegNet到DeepLab
炼数成金订阅号
26+阅读 · 2017年7月10日
Seeing What a GAN Cannot Generate
Arxiv
7+阅读 · 2019年10月24日
A Probe into Understanding GAN and VAE models
Arxiv
9+阅读 · 2018年12月13日
3D-LaneNet: end-to-end 3D multiple lane detection
Arxiv
7+阅读 · 2018年11月26日
Arxiv
4+阅读 · 2018年6月1日
VIP会员
相关VIP内容
最新《生成式对抗网络》简介,25页ppt
专知会员服务
168+阅读 · 2020年6月28日
【论文扩展】欧洲语言网格:概述
专知会员服务
6+阅读 · 2020年3月31日
注意力图神经网络的多标签文本分类
专知会员服务
111+阅读 · 2020年3月28日
【图神经网络(GNN)结构化数据分析】
专知会员服务
114+阅读 · 2020年3月22日
自回归模型:PixelCNN
专知会员服务
25+阅读 · 2020年3月21日
【学科交叉】抗生素发现的深度学习方法
专知会员服务
23+阅读 · 2020年2月23日
【干货51页PPT】深度学习理论理解探索
专知会员服务
60+阅读 · 2019年12月24日
Top
微信扫码咨询专知VIP会员