A major task in genetic studies is to identify genes related to human diseases and traits to understand functional characteristics of genetic mutations and enhance patient diagnosis. Besides marginal analyses of individual genes, identification of gene pathways, i.e., a set of genes with known interactions that collectively contribute to specific biological functions, can provide more biologically meaningful results. Such gene pathway analysis can be formulated into a high-dimensional two-sample testing problem. Due to the typically limited sample size of gene expression datasets, most existing two-sample tests may have compromised powers because they ignore or only inefficiently incorporate the auxiliary pathway information on gene interactions. We propose T2-DAG, a Hotelling's $T^2$-type test for detecting differentially expressed gene pathways, which efficiently leverages the auxiliary pathway information on gene interactions through a linear structural equation model. We establish the asymptotic distribution of the test statistic under pertinent assumptions. Simulation studies under various scenarios show that T2-DAG outperforms several representative existing methods with well-controlled type-I error rates and substantially improved powers, even with incomplete or inaccurate pathway information or unadjusted confounding effects. We also illustrate the performance of T2-DAG in an application to detect differentially expressed KEGG pathways between different stages of lung cancer.


翻译:基因研究的一项主要任务是确定与人类疾病有关的基因和特征,以了解基因突变的功能特征,并加强病人诊断; 除了对个别基因进行边际分析外,查明基因路径,即一组已知相互作用的基因,可以提供更具有生物学意义的结果; 这种基因路径分析可以形成一个高维的二类抽样测试问题; 由于基因表达数据集的抽样规模通常有限,大多数现有的双类测试可能具有妥协的权力,因为它们忽视或只是没有有效地纳入基因相互作用的辅助路径信息; 我们提议T2-DAG, 一家旅馆的$T ⁇ 2美元类型的测试,用于检测不同表达的基因路径,通过线性结构等式模型有效地利用基因相互作用的辅助路径信息; 我们根据有关假设确定试验统计的无症状分布; 各种假设下的模拟研究表明,T2-DAG超越了几种具有良好控制的类型一型错误率和显著改进的功能,甚至以不完全或不精确的路径信息或不精确的路径测量T2-D型癌症的不同性能。

0
下载
关闭预览

相关内容

结构方程模型(Structural Equation Modeling,SEM)是一种建立、估计和检验因果关系模型的方法。模型中既包含有可观测的显在变量,也可能包含无法直接观测的潜在变量。结构方程模型可以替代多重回归、通径分析、因子分析、协方差分析等方法,清晰分析单项指标对总体的作用和单项指标间的相互关系。
【博士论文】开放环境下的度量学习研究
专知会员服务
45+阅读 · 2021年12月4日
专知会员服务
50+阅读 · 2020年12月14日
专知会员服务
52+阅读 · 2020年11月3日
因果图,Causal Graphs,52页ppt
专知会员服务
238+阅读 · 2020年4月19日
【新书】贝叶斯网络进展与新应用,附全书下载
专知会员服务
118+阅读 · 2019年12月9日
机器学习入门的经验与建议
专知会员服务
90+阅读 · 2019年10月10日
已删除
inpluslab
8+阅读 · 2019年10月29日
Nature 一周论文导读 | 2019 年 8 月 22 日
科研圈
4+阅读 · 2019年9月1日
revelation of MONet
CreateAMind
5+阅读 · 2019年6月8日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
Capsule Networks解析
机器学习研究会
10+阅读 · 2017年11月12日
Arxiv
6+阅读 · 2018年10月3日
Arxiv
23+阅读 · 2018年10月1日
VIP会员
相关资讯
已删除
inpluslab
8+阅读 · 2019年10月29日
Nature 一周论文导读 | 2019 年 8 月 22 日
科研圈
4+阅读 · 2019年9月1日
revelation of MONet
CreateAMind
5+阅读 · 2019年6月8日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
Capsule Networks解析
机器学习研究会
10+阅读 · 2017年11月12日
Top
微信扫码咨询专知VIP会员