前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >4️⃣ 核酸序列特征分析(1):开放阅读框识别

4️⃣ 核酸序列特征分析(1):开放阅读框识别

作者头像
Y大宽
发布2019-01-28 10:29:00
2.3K0
发布2019-01-28 10:29:00
举报
文章被收录于专栏:Y大宽Y大宽
序列比对和序列特征分析总目录

阅读框Open Reading Frame,ORF

ORF指的是DNA上的序列,从5'端翻译起始密码子ATG到终止密码子(TAA,TAG,TGA)的蛋白质编码序列。 对于任意给定的一段DNA,有两个问题需要考虑,

  • 一是DNA双链中的哪条是编码链
  • 二是编码区究竟从第一个碱基开始进行编码 所以每条链都有潜在的3种ORF,而对于双链DNA来说就有6种可能的ORF。也就是说先从给定的DNA单链为模版,分别从5'-3'方向第123个碱基开始翻译,再以互补链为模版,分别从3'-5'方向的第123个碱基开始翻译,得到另外3种翻译结果。正链上的正向读码框forward,负链的为反向读码框reverse。6个潜在ORF中,一般选择中间没有被终止密码子隔开的最大的读码框为正确的结果这篇文章对此进行了详细介绍

关于真核和原核的ORF 原核生物基因绝大多数是连续基因,不含内含子。而真核生物基因结构一般为断裂基因,编码区被内含子隔开,又有不同的拼接方式,所以真核生物的ORF长度变化范围比较大,预测就有比原核有难度。但是,真核的ORF中,外显子和内含子之间的连接有GU-AG规律。也就是内含子序列5'端起始的两个核苷酸总是GU,3'端最后两个核苷酸总是AG,即5'-GU......AG3,这可协助识别ORF

ORF预测的工具很多,一般基于以下两种算法,

第一,基于统计学分析和模式分析,从序列本身进行预测,不需要与已有数据库比较,所以速度快,如果缺少待分析物种的数据库信息,这种方法比较好,比如GENSCAN
第二,以同源比对为基础,依赖于已有数据库,预测的正确性比1高。

广泛应用的ORF FinderGENSCAN分别介绍,网址

1输入fasta格式序列

image.png

2 参数选择

image.png

默认1 standard,根据需要选择

3结果如下

image.png

还可以BLAST进行比对。genscan


GENSCAN

image.png

在这里安利一个小工具suite,如果你仔细看就会有惊喜,很实用很方便
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2019.01.25 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 广泛应用的ORF Finder和GENSCAN分别介绍,网址
    • 1输入fasta格式序列
      • 2 参数选择
        • 3结果如下
        • GENSCAN
        相关产品与服务
        数据库
        云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档