前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >使用Eagle2进行单倍型分析

使用Eagle2进行单倍型分析

作者头像
生信修炼手册
发布2019-12-19 11:36:52
1.5K0
发布2019-12-19 11:36:52
举报
文章被收录于专栏:生信修炼手册

Eagle2是一款单倍型分析软件,相比shapeit, 其运行速度提高了20倍左右,准确率也增加了10%,官网如下

https://data.broadinstitute.org/alkesgroup/Eagle/

对应的文章发表在nature genetics上,链接如下

https://www.nature.com/articles/ng.3679

核心算法图示如下

对于reference haplotype, 通过PBWT转换之后构建前缀树,树枝的宽度代表了单倍型的频率,频率越高,树枝越宽。对于study样本的分型结果,将可能的单倍型映射到前缀树中,结合HMM模型来预测对应的单倍型。

和shapiet2等软件进行比较,结果如下所示

从图a可以看出,Eagle2的运行时间最快,而且非常恒定,并不会随着reference panel中单倍型的增多而加大运行时间, shapeit2的运行时间和panel size则基本是一个线性关系。

从图b可以看出,panel size的增加有助于降低错误率,而不同软件之间的比较可以发现,Eagle2的错误率最低。利用1000G和HRC两个reference panel进行比较,可以得出相同的结论,结果如下

HRC的单倍型比1000G多很多,利用HRC进行phasing的错误率显著降低。study样本的对运行时间和准确率的影响如下

可以看到,样本越多,运行时间越久,错误率越低。相比shapeit2, Eagle2的运行速度更快,错误率更低。

该软件的基本用法如下

代码语言:javascript
复制
eagle \
--vcfRef HRC.r1-1.GRCh37.chr20.shapeit3.mac5.aa.genotypes.bcf \
--vcfTarget sample.chr1.vcf.gz \
--geneticMapFile genetic_map_chr1_b37.txt
--outPrefix chr1.phased \

要求输入的study样本和reference panel的格式为VCF/BCF, 而且需要tabix的索引,如果是plink格式,可以通过plink2转换成VCF, 官方推荐使用bcftools进行VCF和BCF的格式转换和建立索引操作。

鉴于Eagle2运行速度和准确率的优势,基因型填充的web服务会使用该软件来进行phasing, 以保证运行速度和用户体验。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-09-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档