首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

生物信息学算法之Python实现|Rosalind刷题笔记:011 DNA六框翻译

开放阅读框(Open Reading Frame, ORF)是由起始密码子开始,直到终止密码子结束,中间不含有其他终止密码子的核酸序列。...需得: 不同的由 ORF 翻译而来的蛋白序列。返回翻译的蛋白序列时可以是任意顺序。...AGCCATGTAGCTAACTCAGGTTACATGGGGATGACCCCGCGACTTGGATTAGAGTCTCTTTTGGAATAAGCCTGAATGATCCGAGTAGCATCTCAG 示例结果 MLLGSFRLIPKETLIQVAGSSPCNLS M MGMTPRLGLESLLE MTPRLGLESLLE Python...in find_orf(dna[i:]) + find_orf(revc[i:]): if orf: amino_acids.append(translate...重叠,因此本题的关键是要找到所有的 ORF(find_orf 函数,使用了双层循环,第一层找起始密码子,第二层找终止密码子) 逐个翻译每个 ORF(translate 函数),最后用 set()函数去除冗余

1.1K30
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    4️⃣ 核酸序列特征分析(1):开放阅读框识别

    序列比对和序列特征分析总目录 阅读框Open Reading Frame,ORF ORF指的是DNA上的序列,从5'端翻译起始密码子ATG到终止密码子(TAA,TAG,TGA)的蛋白质编码序列。...对于任意给定的一段DNA,有两个问题需要考虑, 一是DNA双链中的哪条是编码链 二是编码区究竟从第一个碱基开始进行编码 所以每条链都有潜在的3种ORF,而对于双链DNA来说就有6种可能的ORF。...6个潜在ORF中,一般选择中间没有被终止密码子隔开的最大的读码框为正确的结果。这篇文章对此进行了详细介绍 关于真核和原核的ORF 原核生物基因绝大多数是连续基因,不含内含子。...而真核生物基因结构一般为断裂基因,编码区被内含子隔开,又有不同的拼接方式,所以真核生物的ORF长度变化范围比较大,预测就有比原核有难度。但是,真核的ORF中,外显子和内含子之间的连接有GU-AG规律。...也就是内含子序列5'端起始的两个核苷酸总是GU,3'端最后两个核苷酸总是AG,即5'-GU......AG3,这可协助识别ORF ORF预测的工具很多,一般基于以下两种算法, 第一,基于统计学分析和模式分析

    2.7K30

    父母均为教授的小学生都做肿瘤基因敲除的研究!还只拿了三等奖…

    近日,一项名为「C10orf67 在结直肠癌发生发展中的功能与机制研究」的全国青少年科技创新大赛的获奖作品引发广泛关注。 ?...利用高原适应与肿瘤细胞适应的相似性,本项目前期利用遗传学比较分析了高原家养哺乳动物和对应平原物种的基因组和转录组,发现了高原哺乳动物低氧适应受选择的关键突变基因C10orf67,并构建了C10orf67...基因敲除小鼠,通过细胞生物学,生物化学、动物模型、临床样本分析等方面对C10orf67在结直肠癌发生发展中的作用进行解析,发现C10orf67在结直肠癌中高表达,敲低其表达可以显著抑制细胞的增殖,将细胞阻滞在...进一步的研究表明C10orf67可以调节结直肠癌细胞对化疗药物的敏感性。因此,对C10orf67在结直肠癌中的功能解析,有望为结直肠癌的诊断和治疗提供新的生物标志物和药物靶点。

    44320

    用GenePred注释文件进行数据分析

    axis=1) # merge dataframe by row names 根据GTF画基因的多个转录本结构 以ANXA1基因为例: 按行读取genepred文件,第3,4列为转录本的区间,第4,5列为ORF...再画ORF 和UTR。把第9,10列分割成exon 的starts,stops。遍历每个exon: 如果exon和ORF没有overlap:画成UTR。...反之: 先画成UTR,再把overlap的部分画成ORF。 NOTE: 这里有个trick,后画的部分会覆盖先画的部分。...gene[9].rstrip(',').split(',')]): if start > txstop or stop < txstart: # UTR: no overlap with ORF...但是以GenePred格式为输入的程序,所有代码都不到20行,而且程序清晰简洁,可读性强(当然Python语言的支持也是功不可没),至少新手们有动力看下去,不会被动辄上百行的程序吓跑了。

    3.8K140

    纳米孔RNA直接测序技术揭示了新冠病毒的转录组和表观转录组信息

    ORF10与已知蛋白没有显著同源性。因此,ORF10可能不被表达。总而言之,SARS-CoV-2表达了9种规范性sgRNA(S,3a,E,M,6、7a,7b,8和N)和gRNA。 ?...最后一组局部融合,这导致较小的缺失,主要发生在结构基因和辅助基因中,包括S ORF(图4G,TRS-L-independent local recombination)。 ?...图6A–6C,S RNA上比N RNA修饰的位点更多,与S RNA相比ORF8 RNA上的修饰频率更高。...对sgRNA和ORF的明确定位为病毒蛋白功能研究,复制机制以及致病性中宿主-病毒相互作用的提供前提。...新的ORF可以作为辅助蛋白,调节病毒复制和宿主免疫反应。RNA修饰也可能有助于感染组织中的病毒存活和免疫逃逸。ORF和RNA修饰是SARS-CoV-2特有的还是在其他冠状病毒中保守的,有待检查。

    93820

    重复一篇3分左右纯生信文章(第二部分)

    预后指数PI=(β* C9orf139的表达水平)+(M * 600HG的β表达水平)+(RP5- 965G21.4的β表达水平)+(RP * -436K8.1的β*表达水平)+(β *表达水平CTC-...结果 差异表达的lncRNA谱和临床特征的预后评估 我们在差异表达的lncRNA进行了单变量Cox回归,结果显示总共13个lncRNA(MIR600HG; CC9orf139; CTC-327F10.4...应用多元Cox比例回归确认上述结果,我们发现5个lncRNA(C9orf139,MIR600HG,RP5-965G21.4,RP11-436K8.1和CTC-327F10.4)被证明是独立的PDAC的预后指标...预后指数PI估算如下:( - 0.235 * C9orf139的表达水平)+(-0.403 * MIR600HG的表达水平)+(0.163 * RP5-965G21.4的表达水平)+(-0.187 *...结果显示 CTC-327F10.4和RP5-965G21.4在两组中均为高表达,而C9orf139和MIR600HG,RP11-436K8.1均为高表达。两组中PDAC组的低表达(图4)。

    1.4K31

    原核非已知转录因子结合位点和可能结合的基因预测

    已有: 知道某原核生物某转录因子的DNA序列 目标基因的基因组测序数据 另外还有这个转录因子的靶基因的ORF序列 目的: 1、分析该转录因子结合位点。...相对难的是两点 1 转录因子未知 2 原核生物尤其这个物种的数据库很少 ---- 理论基础,转录因子本质是蛋白质,结合在TSS上游的启动子序列(有的在gene内部) 1.由该TF的DNA序列得到其最大ORF...2.NCBI blastp发现其最大的hit序列(同时用另一个网站再次证实) 3.若去预测整个基因组中其结合的promoter区域不现实也不真实,只看一个已知ORF序列的可能的结合位点 4.得到该基因起始位点上游...-- 1.由该TF的DNA序列得到其ORF >aa MPVANVFSRTAAQRPAPLHTVVIALNVMKEMGVPAEVLLRGTGISPEEIEQANAMVTHAQEMVLFANALEATGNSAIGLHIGSSIPVTAYGLRGHAMLVSPTLGDAMRLAYEHPLMAISYFQITLGVNVDLARVTVGGYTYRADLLVLNTDMCLAAVRREIIDLIGRVPTFRRVGLAFPPPAHASVYSDIFDCEVTFDTEENFLEFDADLLDIRLPLAHSIEFEISRRACEKREFELSHWVPADLVGRLFGIMYDNPTCQDVVKLTGKLGMSPRSLQRKLKEMGTSFSALHDLVRRDIASRYLSENKSTKEIAARLGYKNTSAFSRAMKRWSKLAGD

    2.1K50

    【冠状病毒】2020国自然研究热点中标摘要参考

    冠状病毒-5* 中东呼吸综合征冠状病毒(MERS-CoV)是一种新型且有高致死率的冠状病毒,前期研究初步表明MERS-CoV附属蛋白ORF4b抑制MDA5、RIG-I、MAVS、IKKε、TBK1、...IRF3和IRF7激活的干扰素产生,并可以与MDA5、TBK1和IKKε结合,破坏MAVS与IKKε的形成复合物,抑制磷酸化形式的IRF3产生,而ORF4b在细胞质中拮抗干扰素的分子机制有待进一步明确。...核定位信号去除的ORF4b不能抑制IRF3/7激活的干扰素产生,提示ORF4b在细胞核内也存在着未知拮抗干扰素产生的分子机制。...本课题拟在前期结果基础上,构建ORF4b缺失的感染性克隆,并进行两方面研究:首先明确ORF4b在细胞质中拮抗干扰素产生的具体机制,其次重点研究ORF4b在细胞核中抑制IRF3激活的干扰素产生的分子机制,...全面阐述ORF4b拮抗干扰素产生的分子机制,为寻找潜在有治疗作用的分子靶点提供理论基础。

    27510
    领券