Plant traits such as leaf carbon content and leaf mass are essential variables in the study of biodiversity and climate change. However, conventional field sampling cannot feasibly cover trait variation at ecologically meaningful spatial scales. Machine learning represents a valuable solution for plant trait prediction across ecosystems, leveraging hyperspectral data from remote sensing. Nevertheless, trait prediction from hyperspectral data is challenged by label scarcity and substantial domain shifts (\eg across sensors, ecological distributions), requiring robust cross-domain methods. Here, we present GreenHyperSpectra, a pretraining dataset encompassing real-world cross-sensor and cross-ecosystem samples designed to benchmark trait prediction with semi- and self-supervised methods. We adopt an evaluation framework encompassing in-distribution and out-of-distribution scenarios. We successfully leverage GreenHyperSpectra to pretrain label-efficient multi-output regression models that outperform the state-of-the-art supervised baseline. Our empirical analyses demonstrate substantial improvements in learning spectral representations for trait prediction, establishing a comprehensive methodological framework to catalyze research at the intersection of representation learning and plant functional traits assessment. All code and data are available at: https://github.com/echerif18/HyspectraSSL.


翻译:叶片碳含量与叶片质量等植物性状是生物多样性与气候变化研究中的关键变量。然而,传统野外采样难以在生态学意义的空间尺度上覆盖性状变异。机器学习通过利用遥感高光谱数据,为跨生态系统植物性状预测提供了重要解决方案。尽管如此,高光谱数据的性状预测仍面临标签稀缺性及显著领域偏移(如跨传感器、跨生态分布)的挑战,需要稳健的跨领域方法。本文提出GreenHyperSpectra——一个包含真实世界跨传感器与跨生态系统样本的预训练数据集,旨在为半监督与自监督方法下的性状预测建立基准。我们采用涵盖分布内与分布外场景的评估框架,成功利用GreenHyperSpectra预训练了标签高效的多输出回归模型,其性能优于当前最先进的监督基线。实证分析表明,该方法在性状预测的光谱表征学习方面取得显著提升,建立了一个融合表征学习与植物功能性状评估的完整方法论框架,以推动该交叉领域研究。所有代码与数据公开于:https://github.com/echerif18/HyspectraSSL。

0
下载
关闭预览

相关内容

文本、视觉与语音生成的自动化评估方法综述
专知会员服务
19+阅读 · 6月15日
专知会员服务
22+阅读 · 2021年8月20日
【2022新书】生命科学的数据分析,511页pdf
专知
14+阅读 · 2022年11月15日
时空数据挖掘:综述
专知
34+阅读 · 2022年6月30日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
A Survey of Large Language Models
Arxiv
495+阅读 · 2023年3月31日
Arxiv
180+阅读 · 2023年3月24日
Arxiv
25+阅读 · 2023年3月17日
VIP会员
相关资讯
相关论文
A Survey of Large Language Models
Arxiv
495+阅读 · 2023年3月31日
Arxiv
180+阅读 · 2023年3月24日
Arxiv
25+阅读 · 2023年3月17日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员