项目名称: 代谢组学数据的多层次融合和模型评价方法研究

项目编号: No.21465016

项目类型: 地区科学基金项目

立项/批准年度: 2015

项目学科: 数理科学和化学

项目作者: 易伦朝

作者单位: 昆明理工大学

项目金额: 49万元

中文摘要: 随着仪器分析技术的飞速发展,高通量代谢组学数据的获得已变得不再困难。随之而来的是如何解决这些海量实际数据带来的诸多现实问题。高通量数据,一个显著的特点就是变量数远大于样本的数量。这一特点给数据融合和模型评价带来了一系列的困难。本课题拟在前期的代谢组学研究工作基础上,根据不同类型、不同层次的代谢组学数据融合要求,开发一系列化学计量学数据融合新算法和新策略。揭示不同数据集的数据特征以及数据集之间变量的内在变化规律,建立稳健的数据融合模型,为多中心大范围的代谢组学研究提供技术支撑。另一方面,针对模型评价这个化学计量学、化学信息学和生物信息学都十分关注的基础性问题,从模型参数的统计分布角度出发,寻找与评价模型的预测能力相关的关键因素,建立模型评价新方法和新指标。所建立的方法将应用于疾病的代谢组学研究中,用于建立有良好预测能力的疾病分类模型,为疾病的临床诊断和预后预测提供新的手段。

中文关键词: 化学计量学;代谢组学;数据融合;模型评价

英文摘要: With the rapid development of modern instrumental analytical technologies, it is not very difficult to obtain the high throughput metabolomics datasets any more. However, many new questions followed. A great challenge is how to deal with the practical problems coming with the massive actual datasets. A remarkable characteristic of high throughput datasets is that the number of variables is much bigger than that of the samples. Many difficulties will come out in data fusion and model evaluation because of this specific characteristic of dataset. In this project, a series of chemometric data fusion algorithms and strategies will be proposed aiming to deal with different types and different levels request of metabolomics data fusion, based on our previous metabolomics research works. These methods will applied to build up a robust data fusion model. Furthermore, we will try to reveal the features of datasets obtained from different sources and their inner change rules of variables. It will provide technical support for multi center, large range of metabolomics research. As we all know, model evaluation is a very important basic question for chemometrics, chemoinformatics and bioinformatics. It is also a key question in data processing of metabolomics. In this project, we will deal with this problem from a new angle. The statistical distributions of model parameters will employed to screen the key factors relating with the predictive ability evaluation of model. On this basis, some new methods and new indexes will be proposed for model evaluation. The new algorithms and strategies proposed in the project will be applied to disease metabolomics research. They will help us to build up disease pattern models having good predictive ability, which might be a complement or an alternative for clinical diagnosis and prognostic prediction.

英文关键词: chemometrics;metabolomics;data fusion;model evaluation

成为VIP会员查看完整内容
1

相关内容

36氪研究院 | 2021年中国医疗AI行业研究报告,40页pdf
专知会员服务
82+阅读 · 2021年12月22日
【博士论文】分形计算系统
专知会员服务
33+阅读 · 2021年12月9日
【博士论文】机器学习中的标记增强理论 与应用研究
专知会员服务
29+阅读 · 2021年12月3日
专知会员服务
87+阅读 · 2021年9月4日
专知会员服务
15+阅读 · 2021年8月6日
专知会员服务
55+阅读 · 2021年4月20日
基于生理信号的情感计算研究综述
专知会员服务
61+阅读 · 2021年2月9日
基于深度学习的数据融合方法研究综述
专知会员服务
137+阅读 · 2020年12月10日
基于深度学习的多标签生成研究进展
专知会员服务
142+阅读 · 2020年4月25日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Towards PAC Multi-Object Detection and Tracking
Arxiv
0+阅读 · 2022年4月15日
Arxiv
21+阅读 · 2020年10月11日
Arxiv
14+阅读 · 2018年5月15日
小贴士
相关VIP内容
36氪研究院 | 2021年中国医疗AI行业研究报告,40页pdf
专知会员服务
82+阅读 · 2021年12月22日
【博士论文】分形计算系统
专知会员服务
33+阅读 · 2021年12月9日
【博士论文】机器学习中的标记增强理论 与应用研究
专知会员服务
29+阅读 · 2021年12月3日
专知会员服务
87+阅读 · 2021年9月4日
专知会员服务
15+阅读 · 2021年8月6日
专知会员服务
55+阅读 · 2021年4月20日
基于生理信号的情感计算研究综述
专知会员服务
61+阅读 · 2021年2月9日
基于深度学习的数据融合方法研究综述
专知会员服务
137+阅读 · 2020年12月10日
基于深度学习的多标签生成研究进展
专知会员服务
142+阅读 · 2020年4月25日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员