2型糖尿病的异质性遗传驱动因素病理生理学

微信号:8149027
不接反杀,想去别人群里开挂,开不了不用加。
复制微信号
  在每项研究中,我们都使用自我报告和遗传背景(补充表1和2)将个体分配给祖先。任何未分配给祖先组的人都被排除为人口异常值。Within each ancestry group-specific GWAS, we conducted quality control of genotype data and imputed up to reference panels from the Trans-Omics for Precision Medicine Program51, Haplotype Reference Consortium52, 1000 Genomes Project (phase 1, March 2012 release; phase 3, October 2014 release)53,54, or population-specific whole-genome sequencing55,56,57,58,59,60,61(补充表3)。使用UCSC升降机工具(https://genome.ucsc.edu/cgi-bin/hgliftover)将归根于映射到GRCH38(HG38)的参考面板(HG38)归为HG19。我们排除了归档质量和/或次要等位基因数量(MAC)的SNV< 5 (Supplementary Table 3).   Within each ancestry group-specific GWAS, we tested for association of each SNV with T2D through generalized linear (mixed) modelling, under an additive dosage of the minor allele, with adjustment for age and sex (where appropriate), and additional study-specific covariates (Supplementary Table 3). We used different strategies to account for population stratification and/or kinship: (i) exclude closely related individuals and adjust for principal components derived from a genetic relatedness matrix (GRM) as additional covariates; or (ii) incorporate a random effect for the GRM (Supplementary Table 3). Allelic effects and corresponding standard errors that were estimated from a linear mixed model were converted to the log-odds scale62. We corrected study-level association summary statistics for residual structure by the LD-score regression intercept63 (Supplementary Table 3) using an LD reference that we derived from ancestry-matched haplotypes from continental groups in the 1000 Genomes Project (phase 3, October 2014 release)54. We matched AFA GWASs to the ‘African’ continental group and HIS GWASs to the ‘American’ continental group.   We analysed autosomal bi-allelic SNVs that overlap reference panels from the 1000 Genomes Project (phase 3, October 2014 release)54 and the Haplotype Reference Consortium52. We considered SNVs with MAF >在1000个基因组项目(2014年10月第3阶段发布)中,至少有五个大陆群中的至少有0.5%54。在比较同一单倍型子集中的参考面板时,我们排除了等位基因频率不同的SNV超过20%。   我们使用MR-MEGA10实施的元回归来汇总跨GWASS的汇总统计数据。MR-MEGA模型的等位基因效应异质性与遗传祖先相关,通过将遗传变异的轴作为元回归模型中的协变量包括在内,以捕获GWASS之间的多样性。我们使用所有研究中报告的SNV来构建每对GWASS之间平均效应等位基因频率差异的距离矩阵。我们实施了距离矩阵的多维缩放尺度,以获得三个代表遗传变异轴的主要成分,以在跨祖先组之间分离gwass(扩展数据图1)。   对于每个SNV,我们通过线性回归汇总了跨GWASS的反相变的等位基因效应,包括三个作为协变量的遗传变异轴。我们测试了:(i)与T2D的关联,允许GWASS之间的祖先相关的等位基因效应异质性;(ii)gwass之间祖先相关的等位基因效应异质性(由遗传变异的轴定义);(iii)GWASS之间的残留等位基因效应异质性。MR-MEGA是一种元回归方法,因此不会产生等位基因效应估计值,因为允许这随遗传变异的轴变化。因此,我们还使用Metal64通过固定效应荟萃分析(等位基因效应的反相位加权)汇总了跨GWASS的汇总统计数据。为了评估GWASS之间的残留结构程度,我们计算了多敏化元回归和固定效应荟萃分析的基因组控制膨胀因子65。我们仅考虑了至少五个GWASS中报道的那些SNV进行下游审讯。   我们确定了所有获得全基因组显着性的SNV(P< 5 × 10−8) for association with T2D from the multi-ancestry meta-regression. Clumps were formed around index variants, which were selected using a greedy algorithm in PLINK v.1.9 (ref. 66), after ranking SNVs by ascending P value. SNVs less than 5 Mb from an index SNV were assigned to the clump if r2 >在1000个基因组项目(2014年10月第3阶段)的五个大陆组中,至少有0.05。分隔少于1 MB的索引SNV分配给同一基因座。然后将每个基因座定义为其中包含的索引SNV的上游500 kb的映射。我们认为,如果包含在全基因组显着性的已发表的大规模T2D GWASS中发现的变体,则先前已经报道了它。   我们使用Metal64通过固定效应的荟萃分析(等位基因效应的反相位加权)汇总了跨GWASS的汇总统计数据。我们估计了每个祖先群体的平均效应等位基因频率,并由研究的有效样本量加权。我们使用R软件包元(https://cran.r-project.org/package=meta/)生成了跨祖先组的索引SNV的关联汇总统计图。   我们考虑了用于定义T2D状态和/或与T2D或并发症风险相关的与心脏代谢相关的定量表型。我们排除了GWAS摘要统计数据仅在插定后才获得的表型,以参考国际HAPMAP Project67的参考面板,因为它们没有提供多ancestry荟萃分析中包含的SNV的足够覆盖范围。我们考虑了最大的GWAS荟萃分析(特定于祖先的或多学院),该分析为每个SNV提供了以下关联摘要统计信息:效应等位基因,其他等位基因,等位基因,等位基因效应和相应的标准误差(补充表5)。我们通过固定效应多符合荟萃分析重新调整了T2D风险等位基因的效果估计值,表示jth Index SNV和ITH表型。然后,我们计算了一个由Z分数校正的样本量,其中SIJ是jth指数SNV和ITH表型的效应估计值的标准误差,而Ni是报告ITH表型的最大样本量。如果没有报告关联摘要统计数据,则将Z分数设置为“丢失”。   我们使用R软件包Clustimpute(https://cran.r-project.org/package = clustimpute)进行了索引SNV的K-means聚类。对于预定义的簇数,Clustimpute在第一次迭代中的边缘分布中随机替代了缺失的Z得分,并执行K-均值聚类。在随后的迭代中,缺少z得分,以当前群集分配为条件,因此考虑了表型之间的相关性。在每次迭代中,随着丢失的数据插补的改善,对估算值施加了惩罚权重,并依次减少(零)。最后,我们根据在r软件包nbclust(https://cran.r-project.org/package = nbclust)中实现的27个集群性能索引的多数规则确定了“最佳”聚类数。   我们在线性回归模型中测试了ITH表型与跨簇的索引SNV的关联,其中cjk是一个指示变量,如果将jth index snv分配给kth群集,则占据值1,否则为0。然后将每个表型与每个簇的缔合的强度或方向显示在热图中,其中“温度”是由回归系数γIK和相应的-LOG10 P值的方向定义的。使用R中的GLM函数拟合了回归模型。   我们从Clustimpute的最终估算数据集中提取了心脏代谢表型Z得分。我们计算了jth snv和kth cluster centroid之间的欧几里得距离   其中zij和μIK是jth SNV的z得分,而对于ITH心脏代谢表型,kth群集质心的位置。为了评估群集差异,我们还使用R软件包FACTOEXTRA(https://cran.r-project.org/package=factoExtra)对最终估算数据集的心脏代谢表型z得分进行了主成分分析。   我们在线性回归模型中对T2D与跨簇的索引SNV的关联进行了测试,其中CJK是一个指示变量,如果将jth index snv分配给KTH群集,则依次为0,否则为0,否则为0,并由等位基因效应的差异加权。我们通过比较该模型的偏差与等位基因效应差异的加权来测试了群集对T2D的异质性。为了比较先前报道的群集与先前未报告的簇之间的关联,我们用一个指标变量代替了CJK,如果将jth index snv分配给了先前报道的群集,否则为一个值1,则替换为1。使用R中的GLM函数拟合了回归模型。   对于每个T2D关联信号,我们定义了映射在索引SNV 50 kb之内的“ null” SNV,而在1000个基因组项目(2014年10月3日,第3阶段)的五个大陆组中的任何一个中,索引SNV不在LD(r2> 0.05)中,而指数SNV则不在。如果jth snv是索引SNV,则定义一个指示变量yj,如果jth snv为null snv,则将值1。我们将索引SNV和NULL SNV映射到由Ensembl Project定义的基因区域(版本104)69,包括蛋白质编码外显子,3'UTRS和5'UTRS。我们定义了指示器变量,并且,如果jth snv映射到相应的遗传注释,则每个值1采用值1,否则为0。我们还将索引SNV和NULL SNV映射到来自染色质可及性(CATLAS和Descartes)的单细胞图谱的ATAC-SEQ峰:222个细胞类型,源自30种人类成人和15种人类胎儿组织25,26;和106种源自人脑的细胞类型27。我们定义了一个指示变量XIJ,该变量将为1个值1,如果映射到ITH单元格类型的ATAC-SEQ峰的jth SNV,否则为0。   在每个群集中,我们在ITH细胞类型中为ATAC-SEQ峰的T2D关联建模,在考虑了基因注释后,在FIRTH偏差降低的逻辑回归中,由此建模。   其中f是logit链接函数。在此表达式中,α0是截距,αExon,α3UTR和α5UTR是基因注释的对数折叠富集,而θi是ITH细胞类型中ATAC-SEQ峰的对数折叠富集。我们通过比较了θi= 0和θi不受限制的模型的偏差,对ITH细胞类型进行了富集的测试。我们确定了具有富集的大量证据的细胞类型(P <0.00023,成人和胎儿组织中222种细胞类型的Bonferroni校正; P <0.00047,Bonferroni校正大脑中106个细胞类型)。使用R软件包Logistf(https://cran.r-project.org/package=logistf)拟合所有模型。   对于每个索引SNV,我们通过将元回归模型到T2D风险等位基因的效果对准效果,计算了一个z得分(beta/se),以与每个变异轴关联。对于每个索引SNV,我们确定了与最强关联的遗传变异轴(最大的Z分数)。   我们通过比较ANOVA的两个线性模型:(i)测试了每个集群中索引SNV与遗传变异的ITH轴的Z分数(β/SE)的差异;(i);(ii)。在这些表达式中:f是身份链接函数;Zij是jth Index SNV的Z分数;CJK是一个指示变量,如果将jth索引SNV分配给KTH群集,则采用值1,否则为0;τ0i和τki是回归系数。使用R中的GLM函数拟合了回归模型。   对于每个索引SNV,我们通过在MR-MEGA10中实现的线性回归(包括作为协变量)的线性回归汇总了跨GWASS的反相变的等位基因效应:(i)三个遗传变异轴;(ii)对照中的平均BMI;(iii)在T2D病例中平均BMI。调整BMI后,我们测试了:(i)GWASS之间的祖先相关的等位基因效应异质性;(ii)GWASS之间的残留等位基因效应异质性。调整后,如上所述,我们重新评估:(i)每个遗传变异轴对祖先相关的异质性的贡献;(ii)机械簇之间的祖先相关异质性的差异。   我们测试了分隔的PS的集群特异性成分以及与T2D相关的大血管结局(CAD,缺血性中风和周围动脉疾病),微血管并发症(ESDN和增殖性糖尿病性视网膜病)和T2D ARSTING ers Ression and ers Rease and Allep and ersect and ersect and and and and fare and unep and and and and and and and and and ersect and usect and,日本生物库(BBJ; EAS Ancestry Group)和Genes&Health(G&H; SAS Ancestry Group)。补充方法中提供了队列描述以及测序和基因分型,质量控制和表型推导的细节。   我们对AOURP,BBJ和G&H的每个祖先分别进行了分析。对于每个祖先,我们都使用所有个体,无论T2D状态如何,都对大血管结局进行了分析,并且仅对具有T2D的个体的微血管并发症进行了分析。对于每个分析,我们为每个个体计算了总的PS和集群特异性分区的PS,每个索引SNV由从祖先特定的荟萃分析中由等位基因日志加权。我们没有在PS中包括MAF <1%的索引SNV。我们还排除了BBJ和G&H的归合质量较差(R2 <0.7)的索引SNV,以及与Hardy -Weinberg平衡极偏差的索引SNV(P <10-6)。我们将分区PS的总体PS和每个集群特异性组件标准化为平均零和单位方差。我们通过广义线性回归和T2D发作的年龄通过线性回归测试了与每个血管结局的关联。对于每个结果,我们都考虑了一个模型,其中包括总体PS,然后考虑了每个集群特异性的组件对整个PS的分区PS进行了调整。所有关联分析均使用R中的GLM函数进行。   我们调整了与年龄,性别和前20个主要成分的血管结局的关联分析。在BBJ中,我们还调整了招聘阶段和注册普通疾病(T2D以外)的状态以说明确定性。我们进一步调整了对T2D状态的大血管结局的分析。我们还进一步调整了T2D持续时间的微血管并发症的分析。在AOURP中,我们将年龄定义为上次医院访问的年龄。在BBJ中,我们将年龄定义为第一名的年龄。在G&H中,我们将年龄定义为T2D病例诊断时的年龄,并且最终随访对照。对于CAD,我们还通过将最大发表的多项式CAD GWAS39的CAD PS包括在内,进行了灵敏度分析。PS是由241个有条件独立的CAD关联的索引SNV构造的,由多疗法等位基因对数或祖先特异性效应加权,并标准化为平均零和单位方差。我们调整了与性别的年龄和性别的T2D发作年龄和前20个主要成分的结合分析。在BBJ中,我们还调整了招聘阶段和注册普通疾病(T2D以外)的状态以说明确定性。   对于每个结果,我们通过随机效应的荟萃分析汇总了分区PS的每个群集特异性成分以及跨祖先的总体PS的汇总统计数据。所有荟萃分析均使用R包META(https://cran.r-project.org/package=meta)进行。   我们测试了来自心肌梗死(TIMI)研究组(https://timi.org/)的六项临床试验的EUR患者的心血管和肾脏相关临床结果的关联。补充方法中提供了试验描述和基因分型和质量控制的细节。   在每个试验中,我们计算了每个个体分区PS的总体PS和集群特异性组件,每个索引SNV由欧洲特定于特定于欧洲血统的荟萃分析的等位基因log-or加权。我们将分区PS的总体PS和每个集群特异性组件标准化为平均零和单位方差。随后汇总了六项试验的数据,我们仅考虑了T2D患者的以下临床结果:心肌梗塞,缺血性中风,心血管死亡,心力衰竭住院,心脏衰竭,心房颤动,急性肢体肢体缺血,外周外围反射性反射术,终结肾脏疾病或肾脏死亡和肾上腺疾病。我们在COX比例危害模型下测试了该分区PS的每个群集特异性组成部分与每个临床结果的关联,包括年龄,性别,前十个主要成分以及作为协变量的整体PS。所有关联分析均使用COXPH函数进行了R封装存活(https://cran.r-project.org/package=survival)的EFRON纽带处理。   补充说明中提供了研究级的道德声明。   有关研究设计的更多信息可在与本文有关的自然投资组合报告摘要中获得。

本文来自作者[yjmlxc]投稿,不代表颐居号立场,如若转载,请注明出处:https://yjmlxc.cn/zsfx/202506-7421.html

(12)
yjmlxc的头像yjmlxc签约作者

文章推荐

发表回复

作者才能评论

评论列表(3条)

  • yjmlxc的头像
    yjmlxc 2025年06月20日

    我是颐居号的签约作者“yjmlxc”

  • yjmlxc
    yjmlxc 2025年06月20日

    本文概览:  在每项研究中,我们都使用自我报告和遗传背景(补充表1和2)将个体分配给祖先。任何未分配给祖先组的人都被排除为人口异常值。Within each ancestry group...

  • yjmlxc
    用户062008 2025年06月20日

    文章不错《2型糖尿病的异质性遗传驱动因素病理生理学》内容很有帮助