前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >使用Beagle进行基因型填充

使用Beagle进行基因型填充

作者头像
生信修炼手册
发布2019-12-19 11:30:37
4.3K0
发布2019-12-19 11:30:37
举报
文章被收录于专栏:生信修炼手册生信修炼手册

Beagle是基因型填充常用的软件之一,最新版本为V5.1, 在准确率和运行速度上都有了很大提升,对应的文章链接如下

https://www.cell.com/ajhg/pdfExtended/S0002-9297(18)30242-8

软件的官网如下

https://faculty.washington.edu/browning/beagle/beagle.html

相比同类软件,该软件有两个显著的优势,第一个就是内存消耗小,第二个运行速度快。对于数据量如此大的reference panel数据,提出了一种新的数据存储格式bref3。文章中比较了不同格式消耗的内存大小,结果如下

可以看到,bref3格式的内存消耗最小。关于运行时间的比较结果如下

可以看到Beagle 5.0版本的运行时间最短。该软件采用java语言进行开发,安装简单,直接下载jar文件即可。基本用法如下

代码语言:javascript
复制
java \
-jar beagle.24Aug19.3e8.jar \
ref=chr1.1kg.phase3.v5a.b37.bref3 \
map=plink.GRCh38.map \
gt=input.chr1.vcf.gz \
out=out.chr1.gt

ref参数指定reference panel的数据,支持vcf和bref3两种格式,官网提供了1000G的数据供下载,链接如下

http://bochet.gcc.biostat.washington.edu/beagle/1000_Genomes_phase3_v5a/

map参数指定参考基因组的连锁图谱,是一个可选参数,官网提供了human对应的连锁图谱,链接如下

http://bochet.gcc.biostat.washington.edu/beagle/genetic_maps/

gt参数指定需要填充的study样本的分型结果,格式为VCF, out参数指定输出结果的前缀,填充后的分型结果格式为VCF, 更多细节请参考官方说明文档,链接如下

https://faculty.washington.edu/browning/beagle/beagle_5.1_12Aug19.pdf

Beagle拥有最快的运行速度和最小的硬件资源消耗,当需要快速进行基因型填充时,该软件是最佳选择。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-09-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据保险箱
数据保险箱(Cloud Data Coffer Service,CDCS)为您提供更高安全系数的企业核心数据存储服务。您可以通过自定义过期天数的方法删除数据,避免误删带来的损害,还可以将数据跨地域存储,防止一些不可抗因素导致的数据丢失。数据保险箱支持通过控制台、API 等多样化方式快速简单接入,实现海量数据的存储管理。您可以使用数据保险箱对文件数据进行上传、下载,最终实现数据的安全存储和提取。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档