前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >生物信息学常见文件格式

生物信息学常见文件格式

作者头像
生信菜鸟团
发布2024-07-10 16:48:45
510
发布2024-07-10 16:48:45
举报
文章被收录于专栏:生信菜鸟团

生信技能树学习笔记

fasta:一种基于文本用于表示核酸序列或多肽序列的格式。缩写为 fa

特征: 两部分, id行和序列行.

- id行:以“>”开头, 有时候会包含注释信息,如 chr1、chr2 …

- 序列行:一个字母表示一个碱基/氨基酸,ATCGN 或 20种氨基酸

fastq:一种保存生物序列(通常为核酸序列)及其测序质量得分信息的

文本格式。FASTQ文件中,一个序列通常由四行组成:

• 第一行:以 @ 开头,之后为序列的标识符以及描述信息

• 第二行:为序列信息,如 ATCG

• 第三行:以 + 开头,之后可以再次加上序列的标识及描述信息(保留行)

• 第四行:为碱基质量值,与第二行的序列相对应,长度必须与第二行相同

Gff:

Gtf:

GTF文件如下

Column-t可以让列对齐

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-07-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信菜鸟团 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档