继上周分享了血液中的蛋白组学相关网站后➡【孟德尔随机化】血液循环中的蛋白质组:常用网站一网打尽,今天我们继续扩充孟德尔随机化GWAS数据的来源吧~
今天主要分享与糖尿病、血糖代谢、肥胖、高血压等代谢综合征相关的数据源——
2型糖尿病
“DIAGRAM Consortium:
http://diagram-consortium.org/
点进去就可以找自己想要的数据,包括了2022年最新的GWAS数据,直接下载即可:
在pdf的说明文档里,提供了数据的内容,包括:
- chromosome and position (hg19, build 37)
- chromosome and position ID
- rs ID
- effect allele and other allele
- effect allele frequency
- fixed-effects meta-analysis beta (log-odds ratio)
- fixed-effects meta-analysis standard error (corrected for genomic control)
- fixed-effects meta-analysis association p-value (corrected for genomic control).
可以看到进行MR分析的必要数据都是有的,用起来也很方便。
肥胖
一般来说,MR分析会使用体重指数和根据体重指数调整的WHR(WHRadjBMI)作为肥胖的衡量标准。
“GIANT consortium:https://portals.broadinstitute.org/collaboration/giant/index.php/GIANT_consortium
GIANT联盟是一个国际合作项目,旨在确定调节人体大小和形状(包括身高和肥胖程度)的基因位点。
GIANT研究的人体测量特征包括体重指数(BMI)、身高以及与腰围相关的特征(如根据BMI调整的腰臀比或WHRadjBMI)。
血糖和胰岛素相关
“MAGIC:http://magicinvestigators.org/
MAGIC(Meta-Analyses of Glucose and Insulin-related traits Consortium,葡萄糖和胰岛素相关性状元分析联盟)旨在结合来自多个GWAS的数据,确定影响血糖和代谢性状的更多基因位点。
页面相当简洁,数据下载也没有门槛,取用方便~
数据集包括:
- Genome-wide association study summary statistics for insulin-stimulated glucose uptake
- Loci for insulin processing and secretion provide insight into type 2 diabetes risk
- Large-scale exome array summary statistics resources for glycemic traits to aid effector gene prioritization
- Trans-ancestry and single-ancestry meta-analysis summary statistics of four glycaemic traits
- Fasting glucose and fasting insulin sex-specific and sex-differentiated GWAS meta-analysis summary statistics
- Change in Fasting Glucose Over Time
- HbA1c summary statistics (ancestry-specific and transethnic)
- Modified Stumvoll Insulin Sensitivity Index (ISI) datasets
- Insulin secretion during OGTT
- Metabochip replication datasets
- Glucose and insulin results accounting for BMI
- Fasting proinsulin datasets
- 2hr glucose datasets
- Fasting insulin and fasting glucose datasets
根据自己的文章设计选择不同的表型数据,按需下载。
高血压
高血压的数据源相对散一些,有的来源于文献,另外就是ieu open gwas和finngen数据库
“https://r9.finngen.fi/pheno/I9_HYPTENSESS
https://gwas.mrcieu.ac.uk/datasets/ukb-b-12493/
文献在这里:A genome-wide cross-phenotype meta-analysis of the association of blood pressure with migraine
文献自带的GWAS数据一般都在Supplementary information
里,这篇也是如此,可以直接复制table中的数据“为我所用”~
写在后面
月底菜编要开题,所以代码部分暂时搁置了【之前发过的全流程代码(一)不知道有没有同学尝试过,让我康康~】,如果在运行过程中有任何问题欢迎后台留言或者评论区提问,我已经提前踩过坑了,或许可以为大家提供一丢丢帮助💪
可以看到,学孟德尔随机化之前要学gwas数据分析
全基因组关联研究(GWAS)是一种研究方法,用于在大量人群中寻找基因变异与疾病或某种表型特征之间的关联。以下是GWAS数据分析的基本步骤:
- 样本收集:首先,研究者需要收集足够数量的样本,这些样本通常包括疾病患者(案例组)和健康人群(对照组)。
- 基因分型:然后,使用基因分型技术(如SNP芯片)对每个样本进行全基因组的基因分型。
- 质控:在进行关联分析之前,需要进行数据质控,包括移除低质量的SNP、移除亲缘关系较近的样本、移除性别不符的样本等。
- 关联分析:然后,使用统计方法(如logistic回归或线性回归)对每个SNP进行关联分析,以确定其与疾病或表型的关联程度。
- 多重检验校正:由于进行了大量的关联测试,需要进行多重检验校正,如Bonferroni校正或假发现率(FDR)校正,以控制I型错误。
- 结果解释:最后,研究者需要解释和解读结果,这可能包括基因功能注释、寻找候选基因、寻找候选通路等。
- 复制研究:为了验证初步GWAS的结果,通常需要在独立的样本集中进行复制研究。
这只是GWAS数据分析的基本流程,实际的分析可能会更复杂,包括考虑人口结构混杂、进行基因-基因和基因-环境交互分析等。