前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >GWAS流程知多少-Hail

GWAS流程知多少-Hail

作者头像
用户1075469
发布2021-12-18 10:20:52
8260
发布2021-12-18 10:20:52
举报
文章被收录于专栏:科技记者

官网hail.is

Hail是一个用于可扩展数据探索和分析的开源库,特别是基因组学,‎为各种规模的基因组分析提供强劲支持,云原生的基因组数据框架和批处理计算‎。Hail需要Python 3和Java 8 JRE[1], GNU/Linux 还需要 C 和 C++标准库(如果尚未安装)。有关库的高级用法,请参阅概述[2],有关全基因组关联研究的简单示例,请参阅GWAS 教程[3],以及安装页面[4]以开始使用 Hail。

最新版本0.2.80发布于 2021-12-15,实时更新中呀,未来可期!

Hail的特点

简化的分析

Hail Query 提供功能强大、易于使用的数据科学工具。查询各种规模的数据:从笔记本电脑上的小型数据集到云中的生物样本库规模数据集(例如UK Biobank,gnomAD,TopMed,FinnGen和Biobank Japan)。

基因组数据帧

现代数据科学由数字矩阵(参见Numpy)[5]和表(参见R[6]数据帧和pandas[7])驱动。虽然对于许多任务来说已经足够了,但这些工具都不能充分捕获遗传数据的结构。遗传数据将基质的多个轴(例如变体和样本)与表格的结构化数据(例如基因型)相结合。为了支持基因组分析,Hail引入了一种功能强大的分布式数据结构,结合了矩阵和数据帧的特征,称为MatrixTable。[8]

输入统一

Hail MatrixTable[9]统一了多种输入格式(例如.vcf、bgen、plink、tsv、gtf、bed 文件),并支持可扩展的查询,即使在 PB 大小的数据集上也是如此。Hail的MatrixTable抽象为科学提供了一个集成且可扩展的分析平台。

GWAS流程

Hail | GWAS Tutorial[10]提供Hail功能的广泛概述,重点是操作和查询遗传数据集的功能。我们进行了全基因组SNP关联测试,并证明了需要控制由群体分层引起的混杂。‎ 详细流程,基本是Python代码,是不是对Python党非常友好,学起来呀!

参考资料

[1]Java 8 JRE: https://adoptopenjdk.net/index.html

[2]概述: https://hail.is/docs/0.2/overview/index.html

[3]GWAS 教程: https://hail.is/docs/0.2/tutorials/01-genome-wide-association-study.html

[4]页面: https://hail.is/docs/0.2/getting_started.html

[5]Numpy): https://numpy.org/

[6]R: https://www.r-project.org/about.html

[7]pandas: https://pandas.pydata.org/

[8]称为MatrixTable。: https://hail.is/docs/0.2/overview/matrix_table.html?highlight=matrix%20table

[9]Hail MatrixTable: https://hail.is/docs/0.2/overview/matrix_table.html?highlight=matrix%20table

[10]Hail | GWAS Tutorial: https://hail.is/docs/0.2/tutorials/01-genome-wide-association-study.html

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-12-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 科技记者 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Hail的特点
    • 简化的分析
      • 基因组数据帧
        • 输入统一
          • 参考资料
      • GWAS流程
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档