生信技能树学习笔记
fasta:一种基于文本用于表示核酸序列或多肽序列的格式。缩写为 fa
特征: 两部分, id行和序列行.
- id行:以“>”开头, 有时候会包含注释信息,如 chr1、chr2 …
- 序列行:一个字母表示一个碱基/氨基酸,ATCGN 或 20种氨基酸
fastq:一种保存生物序列(通常为核酸序列)及其测序质量得分信息的
文本格式。FASTQ文件中,一个序列通常由四行组成:
• 第一行:以 @ 开头,之后为序列的标识符以及描述信息
• 第二行:为序列信息,如 ATCG
• 第三行:以 + 开头,之后可以再次加上序列的标识及描述信息(保留行)
• 第四行:为碱基质量值,与第二行的序列相对应,长度必须与第二行相同
Gff:
Gtf:
GTF文件如下
Column-t可以让列对齐