作者:王雪洁 编辑:肖冉

介绍

今天介绍一篇由Peihua Ma等人于2022年5月发表在Food Chemistry上的文章。本文作者提出了一种基于深度学习的通用技术来预测食物种类和营养成分。

开发了一种食品配料语句嵌入方法,包括配料数据解析、数据采样、数据编码和配料语句张量表示,该方法也可应用于其他与食品语言数据处理相关的任务。随后,应用了四种最先进的深度学习模型,包括多层感知器(MLP)、递归神经网络(RNN)、卷积神经网络(CNN)和图形神经网络(GNN)。 摘要

确定诸如食品分类、创建分类法和食品营养成分等属性可能是一项具有挑战性和资源密集型的任务,尽管对于更好地了解食品很重要。在这项研究中,从 USDA 品牌食品数据库中收集了一个新的数据集 134 k BFPD,并对其进行了修改,并用三种食品分类和营养值进行了标记,并成为了一个人工智能 (AI) 数据集,涵盖了迄今为止最大的食品类型。总体而言,多层感知器 (MLP)-TF-SE 方法在使用 AI 的食品自然语言处理任务中获得了最高的学习效率,其对食品分类的准确率高达 99%,对钙的估计达到 0.98 R2(0.93 ∼ 0.97 for卡路里、蛋白质、钠、总碳水化合物、总脂质等)。深度学习方法具有巨大的潜力,可以嵌入到其他食品分类和回归任务中,并作为食品和营养领域其他应用的扩展。

图1. 食物深度学习 (a)输入数据-成分列表和营养信息从BFPD获得。(b1)使用自然语言处理(b2)数据编码对成分列表进行单词解析,将成分、类别和营养信息字符串转换为机器可以学习的矩阵。(c) 数据采样包括两个步骤,数据重新平衡和拆分,并转换为数据张量。(d) 深入学习。标记张量用于训练深度学习模型以实现目标。(e) 深度学习模型可以在食品领域实现不同的应用,如食品营销分析、新颖的食品设计和个性化的饮食建议。

结果

图2显示了不同分类法的分类准确性。四种传统的机器学习模型(即K-means、Adaboost、线性SVM和贝叶斯)的准确率在0.3%到43.2%之间,表明无法根据成分声明预测类别。然而,与使用传统机器学习方法获得的结果形成鲜明对比的是,所有深度学习模型(即MLP、ResNet(残差网络,CNN)、LSTM(长-短期记忆,RNN)和IDGL(迭代深度图学习,GNN))的准确率均在83.3%到85.9%之间。

图2. 具有不同修改的不同机器学习模型之间类别预测的准确性。TF组-通过术语频率逆文档频率方法进行数据编码。SE组-通过最近邻法编辑的合成少数过采样技术重新平衡数据。

为了证明该策略的可移植性,选择了卡路里和五种有代表性的营养成分,包括三种基本营养成分,即蛋白质、总碳水化合物和总脂质,以及两种矿物质,即钠和钙。图3a显示预测营养价值的五个评估指标,包括准确性、R2、随机样本一致性斜率(RANSAC)回归、皮尔逊相关系数和斯皮尔曼相关系数四种深度学习模型(即MLP、LSTM(RNN)、ResNet(CNN)和IDGL(GNN))。图3b和图3c显示了卡路里和钠的真实值和预测值之间的关系。每个图中的绿线表示一个RANSAC,图中的椭圆表示95%的置信度。

图3. (a) 不同深度学习模型对六种代表性营养素的预测结果。轴的范围为精度[0.5,1.0],R2[0.8,1.0],RANSAC[0.8,1.0],Pearson [0.9,1.0],Spearman [0.9,1.0],颜色表示四种深度学习模型,红色表示MLP,橙色表示ResNet,蓝色表示LSTM,绿色表示IDGL;(b) 标记的卡路里值与预测的卡路里值之间的关系;(c) 标记的钠值与预测的钠值之间的关系。 结论

基于美国农业部134 k BFPD食品成分声明的深度学习方法实现了高达99%的食品分类准确度和0.98的R2营养素估计。该策略包含四个部分,即高频成分分析,TF-IDF成分编码,SMOTEENN数据集再平衡以及应用于四种最先进的深度学习模型的预处理生成的数据张量。四种模型分别为多层感知器(MLP)、RNN(LSTM)、CNN(ResNet)和GNN(IDGL)进行比较。此外,为了证明系统的可移植性,实施了各种分类任务(例如BFPD、IRI和WWEIA分类)和各种营养素(例如卡路里、蛋白质、总碳水化合物、总脂质、钠、钙),以在实践中达到可接受的准确度。深度学习方法通常比传统的机器学习方法提高估计精度100%以上。
**参考文献:**Ma P, Zhang Z, Li Y, et al. Deep learning accurately predicts food categories and nutrients based on ingredient statements [published online ahead of print, 2022 May 19]. Food Chem. 2022;391:133243. doi:10.1016/j.foodchem.2022.133243

长按关注我们

微信号|FoodAI 合作/投稿|jiedong@csu.edu.cn

yunyonghuan@hainanu.edu.cn

成为VIP会员查看完整内容
7

相关内容

医学领域的人工智能是使用机器学习模型搜索医疗数据,发现洞察,从而帮助改善健康状况和患者体验。 得益于近年来计算机科学和信息技术的发展,人工智能 (AI) 正迅速成为现代医学中不可或缺的一部分。 由人工智能支持的人工智能算法和其他应用程序正在为临床和研究领域的医学专业人员提供支持。
使用深度学习进行生物网络分析
专知会员服务
16+阅读 · 2022年6月30日
Nat. Methods | MSNovelist:从质谱生成小分子结构的新方法
专知会员服务
3+阅读 · 2022年6月22日
【WWW2021】少样本图学习分子性质预测
专知会员服务
35+阅读 · 2021年2月20日
【文本生成现代方法】Modern Methods for Text Generation
专知会员服务
43+阅读 · 2020年9月11日
专知会员服务
131+阅读 · 2020年8月24日
金融时序预测中的深度学习方法:2005到2019
专知会员服务
165+阅读 · 2019年12月4日
Auto-Keras与AutoML:入门指南
云栖社区
16+阅读 · 2019年2月9日
从0到1,这篇深度学习综述送给你!
机器学习算法与Python学习
27+阅读 · 2018年6月13日
深度学习之CNN简介
Python技术博文
20+阅读 · 2018年1月10日
机器学习(17)之集成学习原理总结
机器学习算法与Python学习
19+阅读 · 2017年9月16日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
11+阅读 · 2008年12月31日
Arxiv
13+阅读 · 2021年3月29日
Learning in the Frequency Domain
Arxiv
11+阅读 · 2020年3月12日
VIP会员
相关VIP内容
使用深度学习进行生物网络分析
专知会员服务
16+阅读 · 2022年6月30日
Nat. Methods | MSNovelist:从质谱生成小分子结构的新方法
专知会员服务
3+阅读 · 2022年6月22日
【WWW2021】少样本图学习分子性质预测
专知会员服务
35+阅读 · 2021年2月20日
【文本生成现代方法】Modern Methods for Text Generation
专知会员服务
43+阅读 · 2020年9月11日
专知会员服务
131+阅读 · 2020年8月24日
金融时序预测中的深度学习方法:2005到2019
专知会员服务
165+阅读 · 2019年12月4日
相关资讯
Auto-Keras与AutoML:入门指南
云栖社区
16+阅读 · 2019年2月9日
从0到1,这篇深度学习综述送给你!
机器学习算法与Python学习
27+阅读 · 2018年6月13日
深度学习之CNN简介
Python技术博文
20+阅读 · 2018年1月10日
机器学习(17)之集成学习原理总结
机器学习算法与Python学习
19+阅读 · 2017年9月16日
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
11+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员