前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >使用FastQTL进行cis-eQTL分析

使用FastQTL进行cis-eQTL分析

作者头像
生信修炼手册
发布2019-12-19 13:01:06
2.8K0
发布2019-12-19 13:01:06
举报
文章被收录于专栏:生信修炼手册生信修炼手册

FastQTL是一款专门用于cis-eQTL分析的软件,在GTEx项目中就是采用该软件进行cis-eQTL的分析,对应的文章发表在Bioinformatics杂志上,链接如下

https://academic.oup.com/bioinformatics/article/32/10/1479/1742545

源代码保存在sourceforge上,网址如下

http://fastqtl.sourceforge.net/

该软件具有以下几个特点

  1. 运行速度快,通过beta分布来进行置换检验,只需要100到1000次的置换检验就可以达到显著性水平;
  2. 支持离散性和连续性的协变量,同时也可以对基因表达量进行归一化
  3. 用法简单,只需要输入标准的文件格式,就可以方便的运行
  4. 支持多线程,可以充分利用计算机资源

官网提供了可以执行的二进制文件,直接下载即可

在运行前需要准备好以下3种文件

1. Genotypes

SNP分型结果对应的文件格式为VCF, 内容示意如下

在INFO中,包含了GT和DS两个字段的信息,GT表示基因分型的结果,0表示ref allele, 1表示alt allele; DS表示基因剂量。官方推荐使用DS这个字段的信息。

对于VCF文件,需要压缩之后,用tabix软件建立索引,命令如下

代码语言:javascript
复制
bgzip genotypes.vcf && tabix -p vcf genotypes.vcf.gz
2. Phenotypes

表型就是基因的表达量信息,内容示意如下

前4列记录了基因的染色体位置,后面的列是每个样本中的表达量信息,该文件是一个bed格式的文件,同样的也需要压缩并建立索引,命令如下

代码语言:javascript
复制
bgzip phenotypes.bed && tabix -p bed phenotypes.bed.gz
3. Covariates

协变量可以是离散型,也可以是连续性,内容示意如下

每一行表示一个协变量,上述文件表示的是一个群体分层的协变量。 准备好这3个文件之后,就可以进行分析了,基本用法如下

代码语言:javascript
复制
fastQTL --vcf genotypes.vcf.gz \
  --bed phenotypes.bed.gz \
  --region 22:17000000-18000000 \
  --out nominals.default.txt.gz

输出结果的内容示意如下

第一列为基因ID, 第二列为snp ID, 第三列为基因和SNP之间的距离, 软件默认分析距离1M以内的SNP-Gene对, 第四列为pvalue值。更多用法请参考官方的说明文档。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-12-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. Genotypes
  • 2. Phenotypes
  • 3. Covariates
相关产品与服务
文件存储
文件存储(Cloud File Storage,CFS)为您提供安全可靠、可扩展的共享文件存储服务。文件存储可与腾讯云服务器、容器服务、批量计算等服务搭配使用,为多个计算节点提供容量和性能可弹性扩展的高性能共享存储。腾讯云文件存储的管理界面简单、易使用,可实现对现有应用的无缝集成;按实际用量付费,为您节约成本,简化 IT 运维工作。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档