专栏首页HUBU生信简介不同的文件格之Fasta格式

简介不同的文件格之Fasta格式

在浏览核酸蛋白质数据库的时候会经常遇见不同的文件格式,常见的有Fasta格式文件、NBRF/PIR格式文件、 EMBL/SWISSPROT格式文件、Clustal(*.aln)格式文件、GCG/MSF(Pileup)格式文件、RSF 格式文件、GDE格式文件、Mega格式文件、Genbank格式文件、NEXUS格式文件、Phylip格式文件等。

Fasta格式

Fasta格式包含序列文件和质量文件

1.Fasta序列文件格式是核酸蛋白数据最常见的一种文件格式,第一行以'<'开头引导的序列名称开始,后面接序列的详细信息,随后的行接序列,每一行序列长度不超过80。序列由标准的IUB/IUPAC氨基酸和核酸代码表,出常见的ATCGU、20种常见氨基酸外还有下表1.1和1.2中代表的字符,'-'代表不明长度的字符序列。

2.Fasta格式质量文件第一行和序列文件一样,只是序列部分对应的是每个碱基的质量,用空格分隔。

Fasta格式序列文件

全文结束,欢迎在评论区讨论~

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • linux环境下R语言的安装运行以及程序包的下载

    R是一种多功能型统计绘图软件,可以方便的编写函数、建立模型,具有良好的扩展性。目前在R网站上约有2400个程序包,涵盖了基础统计学、社会学、经济学、生态学、空间...

    HUBU生信
  • sam文件格式说明

    bowtie2是当前最流行的短序列比对软,SAM(SequenceAlignment/Map)格式是一种通用的比对格式,用来存储reads到参考序列的比对信息S...

    HUBU生信
  • 第二次RNA-seq实战总结(2)-数据下载并进行数据处理

    原始数据来源于这篇文章https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE50177 这篇文章的数据适中...

    HUBU生信
  • 最小二乘法原理及matlab实现

    最小二乘法(least squares method),也称最小平方法,是一种古老而常用的数学工具,在自然科学、工程技术和人工智能等领域有着广泛地应用,其核心原...

    matlab爱好者
  • Flink-1.9流计算开发:十二、apply函数

    Flink是下一代大数据计算平台,可处理流计算和批量计算。《Flink-1.9流计算开发:十二、apply函数》cosmozhu写的本系列文章的第十二篇。通过简...

    cosmozhu
  • jenkins 多选框

    背景 jenkins自带的参数化不支持多选框,不过有插件支持:Extended Choice Parameter Plug-In 插件地址: https://p...

    千往
  • 习题 8: 打印,打印

    1 2 3 4 'one' 'two' 'three' 'four' True False False True '%r %r %r %r' '%r %r...

    hankleo
  • R语言操作FASTA文件

    Question: Subsetting a fasta file using seqinr in R

    oriRNA
  • Python函数式编程-map/reduce

    map()函数接收两个参数,一个是函数,一个是Interable,map将传入的函数依次作用到序列的每个元素,并把结果作为新的Iterator返回。

    yaohong
  • 下一代数据分析 将如何改善企业与客户的互动?

    2000年,彼得·莱曼(Peter Lyman)和哈尔·瓦里安(HalR. Varian)开展了一项史无前例的研究。用计算机存储术语来说,他们的目标是弄清楚全球...

    BestSDK

扫码关注云+社区

领取腾讯云代金券