项目名称: 基于DNA理化特性的真核生物启动子计算识别方法研究

项目编号: No.31401136

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 生物科学

项目作者: 杨曦

作者单位: 河南科技大学

项目金额: 20万元

中文摘要: 本项目拟以真核生物启动子具有独特的理化和结构性质为突破口,采用机器学习领域的人工神经网络、高斯混合模型、贝叶斯分类器等方法建立真核生物启动子预测模型,提高启动子预测的准确率和模型的通用性。本项目创新点在于,将“真核生物启动子的生物学功能是通过其独特的理化结构来实现”这一思想引入建模过程,在使用经典序列特征的基础上拟增加序列上下文特征和DNA理化特征,捕捉启动子序列隐含的理化与结构特性,并在预测模型各层结构上做合理改动,使各种特征发挥更充分的区分作用,在选取多个物种作为训练样本的基础上,建立可靠的共识模型,解决以往预测工具过分依赖DNA序列组成信息以及仅对特定物种有效等问题。本项目的开展对寻找区分启动子数据与非启动子数据的规律具有重要意义,为此类生物分类问题提供更有效的编码理论,同时对基因预测中外显子内含子界限准确分割问题、转录起始位点的准确定位都具有重要的借鉴价值。

中文关键词: 启动子预测;层级模型;DNA理化特性;位置权重矩阵;人工神经网络

英文摘要: The project is based on the fact that eukaryotic promoters have special physicochemical and conformational properties, and aims to establish a new eukaryotic promoter prediction model by using several important machine learning methods, such as artificial

英文关键词: Promoter prediction;Hierarchical model;DNA physicochemical features;Position weight matrix;Artificial neural network

成为VIP会员查看完整内容
0

相关内容

医学图像关键点检测深度学习方法研究与挑战
专知会员服务
50+阅读 · 2022年4月10日
ICLR2022 | OntoProtein:融入基因本体知识的蛋白质预训练
专知会员服务
28+阅读 · 2022年2月20日
【博士论文】分形计算系统
专知会员服务
33+阅读 · 2021年12月9日
NeurIPS 2021 | 微观特征混合进行宏观时间序列预测
专知会员服务
40+阅读 · 2021年11月12日
【干货书】数据挖掘药物发现,347页pdf
专知会员服务
134+阅读 · 2021年9月20日
专知会员服务
14+阅读 · 2021年8月2日
【经典书】数据结构与算法,770页pdf
专知会员服务
140+阅读 · 2021年4月15日
【Nature通讯】深度神经网络模型中的个体差异
专知会员服务
13+阅读 · 2020年11月16日
图预训练技术在生物计算领域的应用
GenomicAI
0+阅读 · 2022年2月23日
深度学习预测蛋白质-蛋白质相互作用
机器之心
5+阅读 · 2022年1月15日
python文本相似度计算
北京思腾合力科技有限公司
24+阅读 · 2017年11月6日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
13+阅读 · 2021年10月22日
Arxiv
15+阅读 · 2021年2月19日
小贴士
相关VIP内容
医学图像关键点检测深度学习方法研究与挑战
专知会员服务
50+阅读 · 2022年4月10日
ICLR2022 | OntoProtein:融入基因本体知识的蛋白质预训练
专知会员服务
28+阅读 · 2022年2月20日
【博士论文】分形计算系统
专知会员服务
33+阅读 · 2021年12月9日
NeurIPS 2021 | 微观特征混合进行宏观时间序列预测
专知会员服务
40+阅读 · 2021年11月12日
【干货书】数据挖掘药物发现,347页pdf
专知会员服务
134+阅读 · 2021年9月20日
专知会员服务
14+阅读 · 2021年8月2日
【经典书】数据结构与算法,770页pdf
专知会员服务
140+阅读 · 2021年4月15日
【Nature通讯】深度神经网络模型中的个体差异
专知会员服务
13+阅读 · 2020年11月16日
相关资讯
图预训练技术在生物计算领域的应用
GenomicAI
0+阅读 · 2022年2月23日
深度学习预测蛋白质-蛋白质相互作用
机器之心
5+阅读 · 2022年1月15日
python文本相似度计算
北京思腾合力科技有限公司
24+阅读 · 2017年11月6日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员