撰文(翻译):宋方亮 编辑:肖冉

今天介绍一篇由Arthur Noin de Oliveira等人于2022年8月发表在**Food Chemistry(IF=9.231)**上的文章。该研究旨在开发一个使用机器学习算法的平台,分析质谱数据,对番茄进行有机和非有机的分类。决策树算法被定制用于数据分析,该模型在确定每种水果属于哪个组时达到了92%的准确度、94%的灵敏度和90%的精确度。

01/

介绍

作为世界上最重要的作物之一,番茄在食品中有多种用途,包括天然食品和许多国家日常饮食中的加工产品,这些商品是类胡萝卜素和酚类化合物形式的维生素和抗氧化剂的可靠来源,这些分子的作用对人类健康有益,可以调节许多生化过程,降低慢性疾病的风险。消费者的支付意愿往往倾向于有机和无农用化学品的番茄,然而使用农用化学品的番茄作物在产量和果实的整体方面存在更好的结果,尽管有机番茄和农用化学品处理的番茄在营养成分上没有显著差异,但由于对化学产品的生化反应,矿物质和代谢物水平可能会受到影响。

在准备作物和使用农用化学品或有机肥时,必须考虑确保食品质量和安全。残留监测和代谢物的评估都应该被考虑。本文提出了一个基于ML的番茄分类平台:一种新的食品安全和质量评估工具。该工具提供实时的代谢物概况,能够对使用农用化学品的生产和有机生产进行比较,并调整化学品的使用水平。通过使用代谢组学等质谱学技术建立代谢图谱和数据库。通过成对的m/z数据分析,使用适应性增强(ADA)算法分析质谱数据。使用最先进的MS-ML技术进行食品分类的生物标志物分析。

02/

材料和方法

2.1. 样品制备

来自巴西圣保罗坎皮纳斯地区的农业合作社的番茄组成有机组(对照组)。非有机组(案例)的番茄果实是从巴西圣保罗坎皮纳斯地区市场的五个不同品牌中获得的。实验中每组共使用了80个代表。果实在茎部疤痕区域被切成X形,在切口处放置硅胶60G板并压在番茄上30秒。将硅胶板放在注入400μL的MilliQ水溶液塑料管中,涡旋1分钟后倾倒10分钟。从溶液中提取250µL的上清液等分,并在分析前用甲酸(0.1%)进行电离。

2.2. 高分辨率质谱分析

来自有机组和非有机组(分别为对照组和案例组)的样品在每日内和每日间随机进行光谱数据采集,并直接注入HESI-Q-Exactive Orbitrap质谱仪。

2.3. 生物标记

通过机器学习算法模型提出的每个鉴别性的m/z都用Xcalibur 3.0软件进行质谱确认。使用METLIN、HMDB和LIPIDMAPS数据库以及文献搜索和综述,使得分子识别命题成为可能。

2.4. 用机器学习算法进行数据分析

为质谱数据开发了一种预处理方法,用于m/z对齐、数据标准化和去噪。潜在的m/z被排列成对,以确定机器学习建模的特征,并使用皮尔逊相关系数(r)准备分类器。使用ML的基于决策树的算法自适应提升(ADAboost)模型对光谱数据进行分类,确定潜在生物标志物的成对m/z的鉴别特征。分类器的稳健性通过性能指标的计算得到了证明。

03/

结果和讨论

从10次重复分析的160个样品中共获得1600个光谱向量。每个向量包括在每个重复采集过程中观察到的所有m/z强度。在这个拟合过程结束时,使用28个判别配对的特征提出了一个预测模型。表1描述了该模型的性能指标结果。通过回归曲线拟合确定判别特征(图1),根据特征对模型的重要性进行特征筛选,得到最佳分类器度量结果的特征数量。从分类器确定的28个特征中,得到18个独特的m/z。这18个m/z中有4个与有机西红柿(对照组)有关,12个与非有机西红柿(案例组)有关,使用ΔJ值来区分生物标志物对群体的贡献。 表1 模型拟合后的性能指标结果。

图1 预测特征的最小判别搜索。 在本研究中,通过使用机器学习方法对番茄分类提出的潜在生物标志物进行识别和配对,以提高性能指标,获得更好的分类结果。如表2所示,由一个正的ΔJ m/ z和一个负的ΔJ m/ z组成的特征,根据相应的质量是否以相反的方向变化进行评估,表明有一个有趣的生物标志物二元组。特征8、10、18、19、26和28就属于这种情况。 表2 通过机器学习模型获得用于番茄分类的m/z的生物标记物。

04/

结论

机器学习算法与质谱代谢组学技术相结合,是食品安全和质量分析的一致和稳健的选择。本研究中描述的数据和信息可以作为食品分析进步的基石,也可以作为进一步学习和研究的验证。本研究提出的分子显示了潜在的监测生物标志物,从农用化学品残留到指示成熟度的代谢物。此外,这个平台还提供了加速评估目标化合物的机会,无论是营养物、过敏原还是毒物。最后,机器学习处理的稳健性允许纳入其他补充性的分析方法,如蛋白质组学数据,形成对任何特定食物来源的多维概述。

参考文献

de Oliveira A N, Bolognini S R F, Navarro L C, et al. Tomato classification using mass spectrometry-machine learning technique: A food safety-enhancing platform[J]. Food Chemistry, 2023, 398: 133870.

长按关注我们

微信号|FoodAI 合作/投稿|jiedong@csu.edu.cn

yunyonghuan@hainanu.edu.cn

成为VIP会员查看完整内容
3

相关内容

医学领域的人工智能是使用机器学习模型搜索医疗数据,发现洞察,从而帮助改善健康状况和患者体验。 得益于近年来计算机科学和信息技术的发展,人工智能 (AI) 正迅速成为现代医学中不可或缺的一部分。 由人工智能支持的人工智能算法和其他应用程序正在为临床和研究领域的医学专业人员提供支持。
【药物发现】针对SARS-CoV-2的药物重定位计算策略总结
专知会员服务
3+阅读 · 2022年10月24日
Food Chem|一种用于辨别中国白酒香气的仿生嗅觉识别系统
Nat. Methods | MSNovelist:从质谱生成小分子结构的新方法
专知会员服务
3+阅读 · 2022年6月22日
【干货书】数据挖掘药物发现,347页pdf
专知会员服务
134+阅读 · 2021年9月20日
vivo X Fold:一个被折叠的未来
36氪
0+阅读 · 2022年4月11日
下载 ‖ 十大医疗数据集
机械鸡
103+阅读 · 2017年8月5日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Arxiv
0+阅读 · 2023年1月19日
Arxiv
1+阅读 · 2023年1月19日
Arxiv
0+阅读 · 2023年1月18日
Arxiv
29+阅读 · 2021年11月2日
已删除
Arxiv
32+阅读 · 2020年3月23日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
微信扫码咨询专知VIP会员