前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >生物信息学常见数据格式

生物信息学常见数据格式

原创
作者头像
用户10328045
发布2023-02-17 00:00:52
3400
发布2023-02-17 00:00:52
举报
文章被收录于专栏:R语言小白

生信技能树学习笔记

fasta

一种基于文本用于表示核酸序列或多肽序列的格式,缩写为fa

特征:两部分

-id行:以“>”开头,有时候会包含注释信息

-序列行:一个字母表示一个碱基/氨基酸,ATCGN 或 20种氨基酸

fastq

一种保存生物序列(通常为核酸序列)及其测序质量得分信息的文本格式

通常有四行

第一行 @开头,之后为序列的标识符以及描述信息

第二行 为序列信息,如ATCG

第三行 +开头,之后可以再次加上序列的标识符以及描述信息

第四行 为碱基质量值,长度与第二行一一对应

gff

image.png
image.png

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • fasta
  • fastq
  • gff
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档