前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >孟德尔分析:代谢疾病相关的GWAS数据库

孟德尔分析:代谢疾病相关的GWAS数据库

作者头像
生信菜鸟团
发布2023-09-09 16:57:54
发布2023-09-09 16:57:54
2.8K0
举报
文章被收录于专栏:生信菜鸟团生信菜鸟团

继上周分享了血液中的蛋白组学相关网站后➡【孟德尔随机化】血液循环中的蛋白质组:常用网站一网打尽,今天我们继续扩充孟德尔随机化GWAS数据的来源吧~

今天主要分享与糖尿病、血糖代谢、肥胖、高血压等代谢综合征相关的数据源——

2型糖尿病

“DIAGRAM Consortium: http://diagram-consortium.org/

点进去就可以找自己想要的数据,包括了2022年最新的GWAS数据,直接下载即可:

在pdf的说明文档里,提供了数据的内容,包括:

  • chromosome and position (hg19, build 37)
  • chromosome and position ID
  • rs ID
  • effect allele and other allele
  • effect allele frequency
  • fixed-effects meta-analysis beta (log-odds ratio)
  • fixed-effects meta-analysis standard error (corrected for genomic control)
  • fixed-effects meta-analysis association p-value (corrected for genomic control).

可以看到进行MR分析的必要数据都是有的,用起来也很方便。

肥胖

一般来说,MR分析会使用体重指数和根据体重指数调整的WHR(WHRadjBMI)作为肥胖的衡量标准。

“GIANT consortium:https://portals.broadinstitute.org/collaboration/giant/index.php/GIANT_consortium

GIANT联盟是一个国际合作项目,旨在确定调节人体大小和形状(包括身高和肥胖程度)的基因位点。 GIANT研究的人体测量特征包括体重指数(BMI)身高以及与腰围相关的特征(如根据BMI调整的腰臀比或WHRadjBMI)。

血糖和胰岛素相关

“MAGIC:http://magicinvestigators.org/

MAGIC(Meta-Analyses of Glucose and Insulin-related traits Consortium,葡萄糖和胰岛素相关性状元分析联盟)旨在结合来自多个GWAS的数据,确定影响血糖和代谢性状的更多基因位点。

页面相当简洁,数据下载也没有门槛,取用方便~

数据集包括:

  • Genome-wide association study summary statistics for insulin-stimulated glucose uptake
  • Loci for insulin processing and secretion provide insight into type 2 diabetes risk
  • Large-scale exome array summary statistics resources for glycemic traits to aid effector gene prioritization
  • Trans-ancestry and single-ancestry meta-analysis summary statistics of four glycaemic traits
  • Fasting glucose and fasting insulin sex-specific and sex-differentiated GWAS meta-analysis summary statistics
  • Change in Fasting Glucose Over Time
  • HbA1c summary statistics (ancestry-specific and transethnic)
  • Modified Stumvoll Insulin Sensitivity Index (ISI) datasets
  • Insulin secretion during OGTT
  • Metabochip replication datasets
  • Glucose and insulin results accounting for BMI
  • Fasting proinsulin datasets
  • 2hr glucose datasets
  • Fasting insulin and fasting glucose datasets

根据自己的文章设计选择不同的表型数据,按需下载。

高血压

高血压的数据源相对散一些,有的来源于文献,另外就是ieu open gwas和finngen数据库

“https://r9.finngen.fi/pheno/I9_HYPTENSESS

https://gwas.mrcieu.ac.uk/datasets/ukb-b-12493/

文献在这里:A genome-wide cross-phenotype meta-analysis of the association of blood pressure with migraine

文献自带的GWAS数据一般都在Supplementary information里,这篇也是如此,可以直接复制table中的数据“为我所用”~

写在后面

月底菜编要开题,所以代码部分暂时搁置了【之前发过的全流程代码(一)不知道有没有同学尝试过,让我康康~】,如果在运行过程中有任何问题欢迎后台留言或者评论区提问,我已经提前踩过坑了,或许可以为大家提供一丢丢帮助💪

可以看到,学孟德尔随机化之前要学gwas数据分析

全基因组关联研究(GWAS)是一种研究方法,用于在大量人群中寻找基因变异与疾病或某种表型特征之间的关联。以下是GWAS数据分析的基本步骤:

  1. 样本收集:首先,研究者需要收集足够数量的样本,这些样本通常包括疾病患者(案例组)和健康人群(对照组)。
  2. 基因分型:然后,使用基因分型技术(如SNP芯片)对每个样本进行全基因组的基因分型。
  3. 质控:在进行关联分析之前,需要进行数据质控,包括移除低质量的SNP、移除亲缘关系较近的样本、移除性别不符的样本等。
  4. 关联分析:然后,使用统计方法(如logistic回归或线性回归)对每个SNP进行关联分析,以确定其与疾病或表型的关联程度。
  5. 多重检验校正:由于进行了大量的关联测试,需要进行多重检验校正,如Bonferroni校正或假发现率(FDR)校正,以控制I型错误。
  6. 结果解释:最后,研究者需要解释和解读结果,这可能包括基因功能注释、寻找候选基因、寻找候选通路等。
  7. 复制研究:为了验证初步GWAS的结果,通常需要在独立的样本集中进行复制研究。

这只是GWAS数据分析的基本流程,实际的分析可能会更复杂,包括考虑人口结构混杂、进行基因-基因和基因-环境交互分析等。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-07-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信菜鸟团 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 2型糖尿病
  • 肥胖
  • 血糖和胰岛素相关
  • 高血压
  • 写在后面
    • 可以看到,学孟德尔随机化之前要学gwas数据分析
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档