前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >如何获取完整的GWAS summary数据(1)------GWAS catalog数据库

如何获取完整的GWAS summary数据(1)------GWAS catalog数据库

作者头像
生信与临床
发布于 2022-08-21 08:56:12
发布于 2022-08-21 08:56:12
8.7K0
举报

在孟德尔随机化(Mendelian randomization,MR)研究中,对于暴露数据我们只需要那些显著的SNP信息,这样的信息在各种GWAS数据库中都是很容易获取的。但是,关于结局的数据,由于需要SNP和结局不相关,所以很多时候这种不显著的结果无法直接从文章或者数据库中查询到,这时候我们需要下载完整的GWAS summary数据了,这种数据一般包含上百万乃至上千万的SNP信息,所以数据量比较大(压缩后在200M左右),希望大家有所认识,有所准备。

接下来,我将介绍如何从GWAS catalog下载完整的GWAS summary 数据

首先,进入GWAS catalog的官网(https://www.ebi.ac.uk/gwas/),点击Summary statistics(如下图所示)

进入Summary statistics后点击Available studies(如下图所示)

最后,你将进入如下界面(链接:https://www.ebi.ac.uk/gwas/downloads/summary-statistics)

该界面主要由三部分组成

第一块是 “List of published studies with summary statistics“(如下图所示):这里的GWAS研究都是已经发表的,质量有保证,你可以在检索框(红色标记处)里输入关键词检索感兴趣的表型。

第二块是 “List of prepublished/unpublished studies with summary statistics“(如下图所示):这里的GWAS研究是未发表见刊的(可能是来源于预印本),质量无法保证,你可以在检索框(红色标记处)里输入关键词检索感兴趣的表型。这里的表型可能会比较新,是对已发表数据的补充。当你实在找不到数据时,不妨来这里试试。

第三块是“Additional sources of summary statistics“(如下图所示):这里整理汇总了目前GWAS研究协作体(consortium)的相关信息。一般这些协作体会建有自己的网站来存储数据,我们可以到它们的官网上下载完整的GWAS summary 数据。图中用红色标记的是冠心病研究的协作体。

GWAS catalog数据库是一个宝藏,米老鼠在这里抛砖引玉,希望大家能更深入地研究利用它,也欢迎私信交流你的idea(微信:MedGen16)!

PS: GWAS catalog有时候需要开国外代理模式才能使用,小伙伴们提前准备好哈!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-01-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信与临床 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
R包”gwasrapidd”------快速获取GWAS Catalog数据库的信息
在往期内容中,米老鼠和大家简单介绍过做孟德尔随机化研究使用到的数据库,主要是OpenGWAS, GWAS Catalog 和Phenoscanner这三个。其中,Open GWAS库的数据可以使用“ieugwasr”包来快速获取,具体请参考往期内容。今天我和大家简单介绍一下可以快速获取GWAS Catalog数据库信息的“gwasrapidd”包,该包于近期加入CRAN集。
生信与临床
2022/08/21
11.2K0
R包”gwasrapidd”------快速获取GWAS Catalog数据库的信息
孟德尔随机化理论知识一站式学习
Inferrence the causility between exposures and healthy outcomes using mendelian randomization approaches
用户11414625
2024/12/20
1790
孟德尔随机化理论知识一站式学习
生信工具 | TIGA: Target Illumination GWAS Analytics
全基因组关联研究(GWAS)可以揭示重要的基因型-表型关联,但数据质量和可解释性问题必须得到解决。对于根据现有证据确定目标靶点的药物发现科学家来说,这些问题已不是单一的药物发现研究。作者开发的TIGA(Target Illumination GWAS Analytics)通过对全基因组关联研究(GWAS)中与性状相关的蛋白质编码基因进行评分和排序,促进药物靶点的发现。TIGA可以用相同的基因-性状关联指标对性状进行评分和排序。这一重点应用提供了一种合理的方法,通过该方法,GWAS的发现可以被聚合和过滤,以获得适用的信息,并为药物发现科学家提供可用的证据,为确认药物靶点的优先级,以便于研究。
DoubleHelix
2021/06/17
5780
生信工具 | TIGA: Target Illumination GWAS Analytics
Haplotype Reference Consortium:最大规模的单倍型数据库
在进行基因型填充时,reference panel的选择对填充结果的影响非常大,HapMap包含了3百多万个SNP位点,420个单倍型,1000G包含了8千多万个位点,5008个单倍型。除了这两个常用的reference panel外,还有很多大型的人类基因组测序项目,比如UK10K等等。reference panel包含的单倍型越多,填充的准确率越高,涵盖的SNP位点越多,填充后可以用于GWAS分析的位点就越多,可以更加有效的挖掘关联信号。
生信修炼手册
2019/12/19
1.9K0
Haplotype Reference Consortium:最大规模的单倍型数据库
mqtldb-meQTL预测数据库
之前我们在[[SNP是什么东西?#QTL]]当中提到过,QTL是一种用来预测SNP功能的算法。一般分析SNP影响哪个方面的功能就在前面加什么前缀。[[表观遗传学简介]]当中的DNA甲基化 (DNA methylation) 是一种通过给DNA序列添加甲基来影响基因功能的方式。如果要分析SNP对甲基化的影响,那么就会有meQTL (methylation QTL) 这样的东西。所以这里就给大家介绍两个关于meQTL预测的数据库。Pancan-meQTL: http://gong_lab.hzau.edu.cn/Pancan-meQTL/
医学数据库百科
2022/09/02
7510
mqtldb-meQTL预测数据库
这个发表在 Nature Genetics的水稻全基因组关联数据库 RHRD,很赞!!!
历经半个世纪的发展,杂交水稻育种取得了巨大的成就,培育出了大量的高产、优质、适应环境变化的品系。本数据库是一个综合性的杂交水稻数据库(http://ricehybridresource.cemps.ac.cn/#/),涵盖了从1976年至2017年间发布的486个商业杂交水稻品种信息、基因组变异、表型与全基因组关联数据信息,共计3,325 个样品,5 百万+变异位点和 17 套表型数据,为现代杂交水稻育种提供了宝贵的资源。
生信宝典
2023/09/22
4840
这个发表在 Nature Genetics的水稻全基因组关联数据库 RHRD,很赞!!!
一个优秀的ATAC-seq数据分析资源实战(一)
之前我们给大家介绍了两篇ATAC-Seq数据分析pipeline的优秀综述:综述:ATAC-Seq 数据分析工具大全 和 Omni-ATAC:更新和优化的ATAC-seq协议(NatProtoc),我们今天就来实战介绍!
生信技能树
2025/02/27
1160
一个优秀的ATAC-seq数据分析资源实战(一)
NatMed | 有源代码 | 多基因风险评分识别出不同类型的脂肪肝疾病
Fig. 4: mRNA expression of loci from the liver-specific (discordant) polygenic risk score is more abundant in the liver compared to the visceral adipose tissue.
生信菜鸟团
2025/01/10
1220
NatMed | 有源代码 | 多基因风险评分识别出不同类型的脂肪肝疾病
搞孟德尔随机化热点的小伙伴数据分析能力有点弱啊
其中有一个资源是最新的(2023年10月)NC文章《Genome-wide association analysis of plasma lipidome identifies 495 genetic associations》里面的数据在GWAS catalog ,里面的索引号是 GCST90277238-GCST90277416,但是这个公众号的小伙伴却不知道该如何批量下载, 或者说发现规律去写代码,而且手动整理好全部的链接后下载然后把它当做是宝贝来宣传。。。。
生信技能树
2023/12/21
1.1K4
搞孟德尔随机化热点的小伙伴数据分析能力有点弱啊
如何获取完整的GWAS summary数据(2)------ MRCIEU GWAS数据库
在上一期的内容中,我和大家简单介绍了如何从GWAS catalog数据库中获取完整的GWAS summary数据,不知道大家有没有掌握?
生信与临床
2022/08/21
4.5K0
如何获取完整的GWAS summary数据(2)------ MRCIEU GWAS数据库
数据库介绍 | PharmGWAS:一个基于GWAS的药物再利用知识库
生信菜鸟团
2024/11/23
1270
数据库介绍 | PharmGWAS:一个基于GWAS的药物再利用知识库
生物信息学软件之网页工具和在线数据库
生物信息学领域有许多在线工具和资源,这些工具提供了各种分析和可视化功能,无需用户进行大量的本地安装和配置。而且绝大部分都是大机构开发和维护,知名度比较好的大机构包括:
生信技能树
2023/11/24
7580
生物信息学软件之网页工具和在线数据库
Bioinfo01-孟德尔随机化
这是我之前关于孟德尔随机化相关课题的一个简单笔记。其中包括了关于孟德尔随机化的简单介绍,以及一些one-sample MR 的R 语言实战。
北野茶缸子
2022/05/19
3.9K0
Bioinfo01-孟德尔随机化
共病遗传的研究方法:关于多发性硬化症和炎症性肠炎遗传共病研究的例子
全文6,358字(不含代码),8 图,阅读 25 分钟。封面图源:pexels.com
黄树嘉
2021/10/18
2.3K0
共病遗传的研究方法:关于多发性硬化症和炎症性肠炎遗传共病研究的例子
孟德尔分析:代谢疾病相关的GWAS数据库
继上周分享了血液中的蛋白组学相关网站后➡【孟德尔随机化】血液循环中的蛋白质组:常用网站一网打尽,今天我们继续扩充孟德尔随机化GWAS数据的来源吧~
生信菜鸟团
2023/09/09
2.5K0
孟德尔分析:代谢疾病相关的GWAS数据库
三大基础公共数据库介绍
美国的国家生物技术信息中心(National Center forBiotechnology Information,NCBI,https://www.ncbi.nlm.nih.gov/)是1988年美国国家健康研究所(National Institutesof Health,NIH)和国家医学图书馆(United StatesNational Library of Medicine,NLM)联合发起成立的分子生物学、生物化学、遗传学知识储备和文献整理平台,并逐步演变为大规模生物医药数据存储、分类与管理,生物分子序列、结构与功能分析,分子生物软件开发、发布与维护,生物医学文献收集与整理,全球范围数据提交与专家注释于一体的世界生物医学信息与技术资源数据库。NCBI采用著名的Entrez搜索和信息检索系统,可以进行在线资源检索,同时构建FTP数据资源下载平台(https://www.ncbi.nlm.nih.gov/guide/all/#downloads),方便用户批量下载数据。
SYSU星空
2022/05/05
7K0
三大基础公共数据库介绍
统计遗传学:第四章,GWAS分析
大家好,我是邓飞,今天继续介绍《统计遗传学》这本书,本次介绍第四章:GWAS分析,主要是综述介绍,具体的实操介绍要到八九十章节。
邓飞
2022/07/27
1.9K0
统计遗传学:第四章,GWAS分析
生物信息学数据库分类概览 (第一版)
生物与计算机的结合让生物进入大数据时代,为方便管理各种生物数据,科学家们开发了各式各样的生物数据库。了解与自己研究领域相关的数据库,并加以利用可能会使研究工作得到事半功倍的效果。在此将常用数据库按照以下分类方式大致整理了一下,方便检索。
生信宝典
2018/12/18
3.5K0
最新!多基因风险评分:67.6万人的多数据库分析揭示影响人类寿命的内驱因素
3月23日,Nature Medicine(IF:30.6)杂志发表了一篇多数据库的GWAS基于多基因风险评分/polygenic risk scores (PRSs)的队列研究。
用户6317549
2020/03/26
2.6K0
最新!多基因风险评分:67.6万人的多数据库分析揭示影响人类寿命的内驱因素
爆肝整理肿瘤生信数据库(收藏贴一)
小编为大家爆肝整理了近百个数据库!共分10大类。今天小编先为大家分享前5类。 在整理的过程中,小编发现一些虽然是以前经常被大家推荐使用的数据库,但却已不再维护了,早已不能正常使用了,这种数据库小编也已经贴心的帮大家过滤掉了。那就快来看看有没有你需要的吧!
作图丫
2022/03/29
4.1K0
爆肝整理肿瘤生信数据库(收藏贴一)
推荐阅读
相关推荐
R包”gwasrapidd”------快速获取GWAS Catalog数据库的信息
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文