作者:王雪洁 编辑:肖冉 介绍

今天介绍一篇由北京汉王科技有限公司智能感知实验室的Weihong Liu等人于2022年3月在线发表在Food Chemistry上的文章。本文受小鼠嗅觉系统的启发,开发了一种仿生嗅觉识别系统来区分复杂的气味刺激,将气味受体(OR)的非凡特异性与反向传播(BP)神经网络的出色数据处理能力相结合,以区分中国白酒的香气。

摘要

香气是影响中国白酒感知质量的重要属性,每种白酒都具有独特的挥发性化学物质集合。在这里,设计了一个仿生嗅觉识别系统,将10种小鼠气味受体的最佳面板与反向传播神经网络模型相结合,以区分中国白酒的香气。本文的系统显示出出色的预测能力,平均准确率为96.5%,可以区分不同香气类型的酒,以及同一香气类型中不同品牌和陈酿年份的酒。进一步阐明了酒类香气化合物与气味受体之间的共124种相互作用,以了解分子水平的气味编码,包括14种新脱孤的气味受体。本文的工作代表了结合受体和机器学习来区分复杂气味刺激的概念证明。

图1:仿生嗅觉系统的示意图。右,小鼠嗅觉系统,在该系统中,一系列神经解剖学事件将气味转化为嗅觉感知。左边是仿生嗅觉系统,其中来自异源表达系统的功能性ORs的气味反应剖面被输入到BP神经网络模型中。

材料和方法

材料选择五种中国白酒。利用中国白酒的香气,其中大量挥发性化合物是由多种生化反应产生的,首先获得了基于完整的小鼠或曲目的气味反应谱,并重点研究了白酒香气识别任务中激活的ORs的子集。然后,建立了一个白酒识别模型来评估OR数组的预测能力,并计算每个OR的重要性得分来优化OR组合。使用BP神经网络建立酒类识别模型。在这项研究中,作者使用对每种酒的OR响应作为BP神经网络的输入,并获得酒的身份信息作为输出。最后,通过分析香气的化学成分并识别其或条形码来解码白酒的香气特征。 结果

在1113个小鼠OR中,总共有46个被测试的四种中国白酒中的至少一种激活。作者建立了一个基于46维气味响应曲线数据的白酒识别模型,五种白酒各重复40次。使用60% (120/200) 的气味响应曲线作为训练集,20% (40/200) 作为验证集,其余20%作为测试集。每次训练后,使用验证集来验证模型的学习效果,避免过拟合。经过5000次训练迭代后,损失值稳定收敛(图2A)。

图 2 . 使用46个功能OR的酒类识别模型的预测性能。(A) 损失函数曲线和模型的验证精度。X 轴表示迭代次数。左 Y 轴代表训练损失值。右 Y 轴代表验证准确度。(B) 五种中国白酒的预测分类。

作者计算了每对OR的气味响应值之间的Pearson相关系数,发现存在许多具有强相关性的OR(图3A)。因此,需要通过特征选择进一步筛选最佳OR组合。采用了一种嵌入式方法,可以在数据训练过程中自动执行特征选择。使用极度随机树(ET)作为训练模型,通过学习五个酒样的气味响应数据,对每个OR的重要性进行评分和排序(图3B)。ET自动选择了十个最重要的OR作为最佳组合。十折交叉验证的分类性能测试表明,前10个OR的酒类判别能力与整个功能性OR集相当,平均预测准确率为96.5%(图3C)。

图3 . 特征选择。(A) 特征之间的分类性能冗余。计算了47个特征的 Pearson 相关系数,包括46个功能OR和5个中国白酒样品的标签。热图中的颜色代表 Pearson 相关系数值。(B) 46个功能性 OR 的重要性得分和排名顺序。(C) 不同OR组合的分类性能。X轴表示OR的添加顺序。Y轴表示累积预测精度。显示了每个测试的最佳、最差和平均累积预测精度。

为了提供酒类识别模型的分子基础,接下来阐明了这些芳香化合物与活化的OR之间的关系。首先,通过单一浓度 (300 µM) 的 44 种芳香化合物对 46 种功能性OR进行了成对刺激。其中,36个OR对34种芳香化合物中的至少一种有反应,共包含219种潜在的正向相互作用。在该测试中,确认了26个OR和28种芳香化合物之间共有124个正相互作用(图4)。正如预期的那样,发现广泛调整的OR家族,如MOR256、MOR286和MOR174,被多种芳香化合物激活。引人注目的是,作者的工作导致了14个OR的去孤儿化,其中两个来自没有已知配体的OR家族,并且发现了67种新的受体-配体相互作用,用于先前去孤儿的OR(图4)。

图4 . 26种OR和28种芳香化合物之间的相互作用。在26个OR中,白色背景上的前2个是新的脱孤 OR,没有报告同一OR家族中所有OR的配体;中间的12个浅蓝色阴影是新的孤立OR,其中至少有一个来自同一家庭的孤立OR;深蓝色阴影的底部12个是以前的孤立OR。RRR,测试孔中最大响应与空白对照的相对响应比。(有关此图例中颜色参考的解释,请读者参考本文的网络版本。)

结论

白酒样品陈化年限的鉴定是基于OR的分析的潜在应用。受体MOR110-10,其反应在30年和15年的茅台样品之间存在显着差异。

文中展示了一个概念验证仿生嗅觉识别系统,该系统结合了功能性OR表达和机器学习,可用于区分复杂的气味刺激。此处确定的天然气味剂和OR之间的相互作用为开发用于食品和饮料行业及其他行业的香气检测、重建和模拟的未来工具奠定了基础。 参考文献

Liu W, Zheng Y, Zhang C, et al. A biomimetic olfactory recognition system for the discrimination of Chinese liquor aromas. Food Chem. 2022;386:132841. doi:10.1016/j.foodchem.2022.132841。

长按关注我们

微信号|FoodAI 合作/投稿|jiedong@csu.edu.cn

yunyonghuan@hainanu.edu.cn

觉得内容还不错的话,给我点个“在看”呗

成为VIP会员查看完整内容
4

相关内容

医学领域的人工智能是使用机器学习模型搜索医疗数据,发现洞察,从而帮助改善健康状况和患者体验。 得益于近年来计算机科学和信息技术的发展,人工智能 (AI) 正迅速成为现代医学中不可或缺的一部分。 由人工智能支持的人工智能算法和其他应用程序正在为临床和研究领域的医学专业人员提供支持。
Nat. Methods | MSNovelist:从质谱生成小分子结构的新方法
专知会员服务
3+阅读 · 2022年6月22日
论文笔记|使用递归GNN学习视频实例分割(二)
图与推荐
0+阅读 · 2022年1月28日
【GNN】图神经网络入门之GRN图循环网络
深度学习自然语言处理
17+阅读 · 2020年5月9日
基于二进制哈希编码快速学习的快速图像检索
极市平台
12+阅读 · 2018年5月17日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年10月5日
VIP会员
相关VIP内容
Nat. Methods | MSNovelist:从质谱生成小分子结构的新方法
专知会员服务
3+阅读 · 2022年6月22日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员