前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >R语言rMVP包做GWAS(全基因组关联分析)分析实例

R语言rMVP包做GWAS(全基因组关联分析)分析实例

作者头像
用户7010445
发布2024-05-18 08:47:39
4571
发布2024-05-18 08:47:39
举报

本篇推文的示例数据来源于参考书 《Genome-Wide Association Studies》的第十章 A Practical Guide to Using Structural Variants for Genome-Wide Association Studies。

植物里做GWAS分析通常是选择某个群体做二代基因组测序(有的已经研究比较多的物种比如 水稻、玉米可以能已经发表过很多数据,),测序数据与参考基因组进行比对鉴定变异位点,然后用变异位点和表型特征去做关联分析。变异位点包括snp indel SV SRR STR TIP 等等。表型数据通常常规的植物表型,比如株高、产量、花瓣数量等。也可以是分子层面的代谢物,基因表达量等。也可以是环境数据,鉴定哪些变异位点和环境有关。

变异位点的数据通常是用vcf文件存储(当然也有其他格式)。我这篇推文介绍用vcf文件去做GWAS。

首先介绍一下vcf文件的格式

vcf文件是文本文件,我们在自己电脑上直接用记事本打开就可以查看文件里的内容。通常样本很多的话,对应的文件也会非常大。自己电脑打开还挺费劲的。

vcf 文本里的内容按照特定的模式排列

vcf简单的可以划分为三个部分

1、两个#号开头的行

2、一个#号开头的行

3、零个#号开头的行

表型数据

两列,第一列是样本名字,第二列是表型的值

如果是用rMVP这个R包来做GWAS的话表型数据的样本顺序和vcf文件的样本顺序不一致也可以,但是其他软件有的会要求样本顺序一致

rMVP 这个R包的github主页

https://github.com/xiaolei-lab/rMVP

只使用混合线性模型的代码

代码语言:javascript
复制
setwd("D:/Jupyter/practice/rMVP_GWAS/")

library(rMVP)

MVP.Data(fileVCF="smoove_filtered.vcf",
         filePhe="phenotype.txt",
         sep.phe = "\t",
         fileKin=TRUE,
         filePC=TRUE,
         out="smoove"
)

genotype <- attach.big.matrix("smoove.geno.desc")
phenotype <- read.table("smoove.phe",head=TRUE)
map <- read.table("smoove.geno.map" , head = TRUE)
Kinship <- attach.big.matrix("smoove.kin.desc")
Covariates_PC <- bigmemory::as.matrix(attach.big.matrix("smoove.pc.desc"))


imMVP <- MVP(
  phe=phenotype,
  geno=genotype,
  map=map,
  K=Kinship,
  CV.MLM=Covariates_PC,
  nPC.MLM=10,
  priority="speed",   ##for Kinship construction
  ncpus=2,
  vc.method="BRENT",  ##only works for MLM
  maxLoop=10,
  threshold=0.05,
  method=c("MLM"),
  file.output=c("pmap", "pmap.signal", "plot", "log")
)

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-05-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 小明的数据分析笔记本 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 首先介绍一下vcf文件的格式
  • 表型数据
相关产品与服务
文件存储
文件存储(Cloud File Storage,CFS)为您提供安全可靠、可扩展的共享文件存储服务。文件存储可与腾讯云服务器、容器服务、批量计算等服务搭配使用,为多个计算节点提供容量和性能可弹性扩展的高性能共享存储。腾讯云文件存储的管理界面简单、易使用,可实现对现有应用的无缝集成;按实际用量付费,为您节约成本,简化 IT 运维工作。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档