前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >GWAS学习 | 01-分析路线图

GWAS学习 | 01-分析路线图

作者头像
邓飞
发布2021-02-24 16:08:00
1.2K0
发布2021-02-24 16:08:00
举报

这是一个读者给我写信询问的问题:

初学GWAS,应该知道,GWAS是干什么用的?我的理解,GWAS分为四部分:

1. 数据清洗

1.1 表型数据清洗

•删除异常值•查看数据分布•数据可视化

1.2 基因型数据清洗

•MAF•Call rate•HWE

2 关联分析

2.1 一般线性模型GLM

2.2 混合线性模型

3 结果可视化

3.1 PCA群体结构

3.2 QQ图

3.3 曼哈顿图

3.4 LD衰减图

4. 结果注释

4.1 显著SNP注释

•ANNOVAR•snpEFF

4.2 基因聚类分析

•GO 富集分析•Kegg 通路分析

上面是我之前做的汇总。

整体而言, plink可以手动进行:

•基因型数据质控•MAF•geno•HWE•建模•GLM模型(连续性状)•logistic模型(二分类性状)

TASSEL

•窗口化界面•不用编程,鼠标点点点•需要提前将表型数据和基因型数据整理好•模型• GLM模型•LMM模型•可视化•QQ图•曼哈顿图•LD衰减图

可以看到,TASSEL比较有优势,特别是它具有LMM模型,LMM模型是连续性状主流的分析方法。

其它GWAS分析软件

•R包:GAPIT•R包:FamCPU•R包:rMVP•GEMMA

很多都是相通的,学习一种方法,其它软件也能很快入手。比如我先是用GEMMA,然后GAPIT和TASSEL也能很快上手。

后面,我将之前的文档,重新整理一下,按照这个流程,重新整理一份GWAS cookbook,岂不善哉!

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-01-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 育种数据分析之放飞自我 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 数据清洗
    • 1.1 表型数据清洗
      • 1.2 基因型数据清洗
      • 2 关联分析
        • 2.1 一般线性模型GLM
          • 2.2 混合线性模型
          • 3 结果可视化
            • 3.1 PCA群体结构
              • 3.2 QQ图
                • 3.3 曼哈顿图
                  • 3.4 LD衰减图
                  • 4. 结果注释
                    • 4.1 显著SNP注释
                      • 4.2 基因聚类分析
                      • 其它GWAS分析软件
                      领券
                      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档