前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >单倍型分析软件Haploview的导入格式及使用

单倍型分析软件Haploview的导入格式及使用

作者头像
阿凡亮
发布2020-04-14 14:50:07
7.9K0
发布2020-04-14 14:50:07
举报
文章被收录于专栏:生物信息学生物信息学
在之前的文章已经给大家介绍了Haploview软件的安

Haplovew目前主要接受:Linkage Format;PHASE format;PLINK format;Hapmap format;Haps format等格式的输入文件,下面将对这些文件的具体格式做以介绍。

1

输入文件格式

01

Linkage format输入文件格式

这种格式的文件需要输入两个文件,一个是数据信息文件(sample.ped文件),一个是位置信息文件(sample.info文件)。

  • 如sample.ped文件:(无关个体之间的研究)

该文件的第一列是家系的ID,如果是无关个体之间的研究,该列应为不重复的ID号;

第二列为个体的ID,做无关个体的研究,每个个体的编号不能重复;

第三列是父亲的ID,如果是无关个体的研究,该列为0;

第四列是母亲的ID,如果是无关个体的研究,该列为0;

第五列是个体的性别信息,其中1代表男性,2代表女性,如果研究个体的性别未知,该列用0表示;

第六列是个体的患病情况,0代表患病情况未知,1代表未患病, 2代表患病;

第七列之后,每两列代表个体一个位点的SNP信息,该软件不能识别A/T/C/G/N碱基,因此后续的SNP信息只能用数字表示, 其中1=A; 2=C; 3=G; 4=T; 缺失碱基用0表示;

  • 第二个sample.info文件:

位置信息文件中,主要包括两列:

第一列为SNP的名称,可以是rs号;

第二列是该位点的位置,可以是在染色体上的绝对位置,也可以是相对位置;

注意:这个文件的行数必须和sample.ped文件中第七列后的SNP数目相同,且和sample.ped文件中的位置一一对应)

02

Haps format输入文件格式

这种格式的输入文件的格式主要包括两个文件,一个是位置信息文件,一个是数据信息文件,其中位置信息文件和Linkage format文件相同,数据信息文件(sample1.ped)主要包括以下几列:

  • 如sample1.ped

第一列是家系的ID,如果是无关个体之间,该列应为不重复的编号;

第二列是个体的ID,如果是无关个体,应为不重复的编号;

第三列之后是等位基因的信息,用0-4表示,其中0表示缺失的数据,h表示这个位点是杂合的位点;和Linkage format格式一样,1=A; 2=C; 3=G; 4=T;

03

Hapmap PHASE format文件格式

这种格式的输入文件包括三个独立的文件,其中第一个文件Data file是一个二进制的等位基因信息文件;第二个文件是样本信息文件,包括了样本的ID号,第三个文件是legend文件,包括marker、position、0和1四列,且这四个文件中只有这个文件含有表头行。

04

Hapmap 和Plink format文件格式

Hapmap format和Plink format格式文件可以从网上下载;包括了hapmap和plink格式;

下载的网址为:ftp://ftp.ncbi.nlm.nih.gov/hapmap/genotypes/hapmap3/下载的界面为:

2

软件运行步骤以及结果解释

下面以Linkage format格式为例,讲一下软件的运行步骤以及结果的解释:

首先在Haploview软件的界面中点击Linage Format,出来的界面中显示要输入Data File 和Locus Information File,点击Data file 后面的Browse,输入按照上面格式整理好的文件。(Haploview有一个默认关联,即如果两个文件主要名称一样,且这两个文件应该放在一个文件夹中时,扩展名分别为ped和info,只要导入ped文件,haploview软件会自动导入info文件)

点击LD plot按钮,可以看到如下的图,其中颜色从红色到白色,代表了连锁程度从高到低,深红色表示完全连锁。

点击Haplotypes按钮,出现如下界面,其中灰色的数值表示左右的block在群体中的频率。

Tagger按钮主要用于挑选tagSNPs,r2是指两个位点之间的统计学关联,一般认为r2大于或等于0.8,就可以用一个点代表另一个点。

今天的分享就到这里有什么问题留言吧!

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-10-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生物信息学 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档