首页 > 智能网

这样筛选危险因素让你文章焕然一新!

来源:智能网
时间:2020-12-23 12:05:47
热度:138

这样筛选危险因素让你文章焕然一新!今天跟大家分享的是发表在Mol Genet Genomics杂志上的一篇文章Identification of pleiotropic genes

今天跟大家分享的是发表在Mol Genet Genomics杂志上的一篇文章Identification of pleiotropic genes between risk factors of stroke by multivariate metaCCA analysis.在文章中用了一种新颖的分析方法--metaCCA,然后进行了基于基因的VEGAS2分析,以识别与中风多种危险因素相关的多效性基因。

Identification of pleiotropic genes between risk factors of stroke by multivariate metaCCA analysis

通过metaCCA分析来鉴定中风危险因素之间的多效性基因

一.研究背景

中风是一种临床综合征,中风易感性可能受到许多心血管因素的影响,包括心房纤颤,高血压,冠状动脉疾病和心力衰竭以及代谢性疾病。研究这些危险因素的共同发病机制可能对中风预防和临床干预有益。

全基因组关联分析已检测到与中风相关的20多个显著遗传位点,例如ALDH2,ZFHX3,PITX2,HDAC9,TSPAN2,FOXF2。但是单位点分析的GWAS忽略了不同表型之间的相关信息,因此不能有效识别复杂疾病中的罕见变异?所以在本篇文章中,作者利用metaCCA方法,对GWAS的汇总统计结果进行分析,以探讨多个疾病表型与基因型之间的关系,从而为研究疾病的发病机制提供依据?

二.分析流程

三.结果解读

1.数据处理

作者下载了中风相关的七个GWAS数据集(房颤AF、高血压HBP、冠状动脉疾病CAD、心衰HF、BMI、胆固醇水平、糖尿病)。

表1.从GWAS下载数据集的详细信息

然后作者利用plink软件基于LD信息过滤SNP。接着将过滤得到的SNP注释为其相应的基因。然后接着进行metaCCA分析。

metaCCA也称Summarystatistics based multival rate meta analysis of genome wideassociation studiesusing canonical correlation analysis,是利用典型相关分析(canonical correl ationanalysis,CCA)的原理,对GWAS的汇总统计结果进行分析,以探讨多个疾病表型与基因型之间的关系,从而为研究疾病的发病机制提供依据。metaCCA可有效解决单位点分析的GWAS其忽略不同表型之间的相关信息,而不能有效识别复杂疾病中的罕见变异的难题。

2.通过metaCCA和VEGAS2分析鉴定多效性基因

作者通过metaCCA分析检测到107个与多种表型显著相关的基因。然后使用VEGAS2算法对该基因集进行了测试。通过该算法,作者在测试中鉴定出了20个显著基因(调整p值≤0.05)(表2)。

发现了6个与AF相关的基因(ARHGAP32,MPPED2,SIK3,DOCK9,FUT8,SKAP1);

3个与BMI相关的基因(SKAP1,PVRL2,PLA2G6);

7个与HPB相关的基因(SIK3,PDE3A,DIAPH3,USP8,SPECC1,RAB8A,MACROD2);

4个与CAD相关的基因(SIK3,DOCK9,PVRL2,SMARCA4);

7个与T2D(2型糖尿病)相关的基因(MYRF,DENND5B,FUT8,SKAP1,GMIP,PVRL2,PLA2G6);

9个TC相关的基因(MYRF,SIK3,PDE3A,ZMYM2,NYNRIN,GMIP,PVRL2,SMARCA4,PLA2G6);

1个与HF相关的基因( FUT8)。

表2.过metaCCA和VEGAS2分析鉴定的多效性基因

鉴定的20个多效性基因中的7个(USP8,SPECC1,RAB8A,ZMYM2,DOCK9,FUT8,PLA2G6)之前从未被报道与上述所包含的任何性状相关,属于新鉴定出的基因。上述结果也表明,这些基因可能与中风的几种危险因素有关联,而且可能通过调节下游信号通路来调控中风的发生。

3.鉴定的多效基因的生物学解释

为了进一步了解由metaCCA鉴定的多效性基因调控的下游信号通路,作者基于网络工具Enrichr对metaCCA鉴定的107个基因进行了功能富集分析。结果表明,最常见的富集通路包括葡萄糖醛酸化,黄酮和脂质的代谢,这些代谢被称为中风的代谢危险因素(表3)。

表3.多效性基因的通路富集

为了可视化这些基因编码的蛋白质间的相互作用,作者通过STRING 11.0数据库对GO富集中包含的相同107个基因进行了PPI分析(图1)。

图1.多效性基因的蛋白质-蛋白质相互作用(PPI)网络

为了确定影响中风的潜在风险基因,作者挑选了在VEGAS2测试中证实与多个性状有关联的十个基因(PDE3A,DOCK9,SMARCA4,MYRF,GMIP,FUT8,SKAP1,PLA2G6,SIK3,PVRL2)。然后作者确定了与其中5个选定基因(PDE3A,SMARCA4,GMIP,FUT8,PLA2G6)有关的18条指向缺血性卒中的最短通路(图2A)。结果发现:SMARCA4是所包括基因组中几乎所有基因的驱动基因。SMARCA4可能会通过多种通路调控中风,包括配体依赖性核受体(BCL6,ETS2,HMGB1,HDAC9),转运蛋白(ABCA1,ALB),和其它分子(肌钙蛋白T,PLAT,TNNT2,NR3C1,NOS3)。

另外,作者确定了与其中5个选定基因(PDE3A,SKAPT,FUT8,SMARCA4,PLA2G6)有关的24条指向脑出血的最短通路(图2B)。在这些基因中,SMARCA4和PDE3A也通过多种中间因素影响结果。

(图中实线表示链接分子之间的直接关系(例如:蛋白质之间的相互作用);而虚线表示间接关系(例如:抑制或激活))

图5.基因-性状的通路网络

小结

       在这项研究中,作者将metaCCA方法应用于GWAS汇总统计数据中的7个缺血性和出血性中风的危险因素(AF,CAD,HBP,HF,BMI,TC和T2D),来检验这些因素之间的重叠的遗传关系,并鉴定中风的预测风险基因。首先作者进行了metaCCA分析,以鉴定可能影响中风的多种危险因素的多效基因,并提出了缺血性和出血性中风的几种潜在调控通路。

此研究也存在局限性:由于研究中缺乏个体水平的基因型数据,所以无法确定能被已鉴定基因所解释的变异性的比例。