182000片叶子,帮助科学家预测植物的族谱

2017 年 9 月 10 日 Nature自然科研 Nature自然科研


原文以Massive database of 182,000 leaves is helping predict plants' family trees为标题

发布在2017年7月7日的《自然》新闻上

原文作者:Heidi Ledford

这种新技术可以被用于从花朵到细胞的一切部位,以便分析哪些因素影响植物组成部分的形态。

一株植物的故事就被铭刻在它的叶子上。在寒冷且水分充足的环境下,一棵树更有可能长出拥有锯齿边缘的宽大叶片。但是如果同样的树种生长在温暖干燥的地方,那么它的树叶就可能是小而平滑的。

气候能够影响植物叶子的形状,比如这些枫树叶。

Ross Hoddinott/NaturePhotoLibrary

现在,有一个图谱记载了来自全球75个地点141个植物科的182000种树叶形状,有望让科学家更好地理解植物背后的故事。利用这个图谱,研究者发现单凭树叶形状就精确预测出树叶来源的概率是14.5%,而准确预测其植物科的概率达27.3%。这比用传统手段描述叶片形状所做的预测要准确得多。


研究者希望这种方法可以帮助他们了解更多影响树叶形状的因素,甚至通过分析植物化石的形状来推测古代气候。美国德克萨斯州贝勒大学的一名古植物学家Dan Peppe说:“这是一个潜力无限的数据集。我们离实现树叶形状测试自动化越来越近,我们可以利用这种技术来弄清一种植物的生物分类系统并重构气候。”


这些结果于6月20日登上生物学预印本服务器bioRxiv。植物形态学家、论文主要作者Dan Chitwood还在6月27日美国沃思堡市的2017年植物学大会上展示了该研究。

整理数据

Chitwood曾就职于美国丹佛斯植物科研中心。他和同事把各自对特定植物群(比如葡萄和番茄)的研究数据汇集起来,并且整合了多个项目的大型数据集,这些项目旨在搜集较大范围内的植物物种和生长地点的分类信息。


然后,他们使用一种叫“持续同调”的拓扑方法来分析每一片树叶的形状。这种方法根据周围像素的密度,给图片中的每个像素赋一个值。研究团队将每片树叶分成16部分,然后分析每一部分的值的规律。研究者用搜集到的树叶形状目录来寻找物种之间的生物分类和地理联系。


Chitwood的终极目标是重建“树叶形态大合集”:所有可能的树叶形状的完整目录。“如果你能分析目前存在的和过去存在的所有树叶,结果会是随机的吗?会有一些从未出现过的树叶吗?从未出现是因为植物不能生长出它们吗?”他提出了一系列问题。 

为了对比树叶形状,研究者给图像中的每个像素赋一个值,然后分析这些像素值的规律。

Dan Chitwood

持续同调研究法用途广泛,从神经元网络到音乐乐句结构,都有其用武之地。Chitwood希望它能提供一种统一的方法来分析植物的所有组成部分。其他科学家也热切盼望在自己的研究中应用这种方法。维也纳大学的植物形态学家Yannick Städler想用这种技术分析他日渐扩大的花朵X光图片库。他希望这种技术能帮他克服传统形态学研究手段的弊端。传统研究方法往往需要研究者在图像上把不同物种重复出现的结构特征标记出来。


这些技术在动物研究上很有效,他说,因为动物往往存在明显的特征标记:比如两块骨头的连接处、眼角和鼻尖。但是一般来说,花朵表面顺滑且又弧度,这就给研究者定位特征标记增加了难度。Städler说:“这是树叶和花朵研究中的一大困难,它阻碍了我们的研究。”

细辨每一片叶子

Peppe等古植物学家一直在寻找叶子化石分析自动化的方法——目前,科研人员需要手动在化石上标出特征标记,然后再进行分析。


还有其他项目也致力于分析植物特征,包括叶子、果实和花朵。它们帮助研究者和爱好者快速在野外认出植物。比如,法国国际发展农业研究中心的植物学家Pierre Bonnet介绍说,有一个叫Pl@ntNet的项目收集了世界各地的用户通过手机应用上传的数百万张照片。到目前为止,这个项目已经利用机器学习技术分析了来自13000种植物的580000张图片。


法国计算机科学与自动化研究所的计算机科学家、Bonnet的合作者之一Alexis Joly说,在辨认植物方面,Pl@ntNet比Chitwood的图谱更胜一筹。他还说,团队目前还没有使用Pl@ntNet来研究叶片形状的多样性。


Chitwood希望能将他的拓扑法得到的结果应用到机器学习算法中去,来看看它们是否能提高他对植物分类及地理位置预测的准确性。但是他更感兴趣的是研究叶片形状而不是植物分类。


Städle说,曾经有一段时间植物形态学的研究似乎日渐没落。但是,现在正在逐渐复兴,这在一定程度上得益于全球掀起的表征植物(尤其是农作物)性状的热潮以及从遗传学和环境角度出发对它们进行的研究。


Städle说:“植物形态学正在重生,它标志着未来的发展方向。而且我认为,尤其在结合遗传学数据后,我们的未来非常光明。”

Nature|doi:10.1038/nature.2017.22230

点击“阅读原文”阅读英文原文

相关文章


一张包含160多个品种的犬类系谱图揭示了狗狗的隐秘历史。

点击此处阅读:为什么要研究狗的家谱?

版权声明:

本文由施普林格·自然上海办公室负责翻译。中文内容仅供参考,一切内容以英文原版为准。欢迎转发至朋友圈,如需转载,请邮件Chinapress@nature.com。未经授权的翻译是侵权行为,版权方将保留追究法律责任的权利。


© 2017 Macmillan Publishers Limited, part of Springer Nature. All Rights Reserved



登录查看更多
0

相关内容

【元图(Meta-Graph):元学习小样本连接预测】
专知会员服务
64+阅读 · 2020年5月31日
【IJCAI2020】图神经网络预测结构化实体交互
专知会员服务
42+阅读 · 2020年5月13日
【ICMR2020】持续健康状态接口事件检索
专知会员服务
17+阅读 · 2020年4月18日
【论文扩展】欧洲语言网格:概述
专知会员服务
6+阅读 · 2020年3月31日
【自监督学习】OpenAI科学家一文详解自监督学习
产业智能官
25+阅读 · 2020年3月18日
Deep-CEE:AI深度学习工具,帮助天文学家探索深空
深度学习探索
5+阅读 · 2019年7月21日
机器学习数据集哪里找:优秀数据集来源盘点
云栖社区
10+阅读 · 2019年1月30日
AI 辅助科学,预测地震余震位置
谷歌开发者
7+阅读 · 2019年1月24日
人工智能能够预测地震吗?
人工智能学家
7+阅读 · 2018年12月10日
手把手教你从零起步构建自己的图像搜索模型
AI研习社
5+阅读 · 2018年7月30日
Arxiv
6+阅读 · 2020年2月15日
Arxiv
5+阅读 · 2019年11月22日
Real-time Scalable Dense Surfel Mapping
Arxiv
5+阅读 · 2019年9月10日
UPSNet: A Unified Panoptic Segmentation Network
Arxiv
4+阅读 · 2019年1月12日
Arxiv
4+阅读 · 2018年6月1日
Arxiv
6+阅读 · 2018年3月25日
VIP会员
相关资讯
Top
微信扫码咨询专知VIP会员