专栏首页生物信息学植物miRNA的鉴定原理

植物miRNA的鉴定原理

MicroRNA(miRNA)是调节动植物中的基因表达的内源性小RNA。在植物中,这些21-22nt的小RNA是由Dicer酶通过两步切割具有茎环结构的初级miRNA转录物产生, 并被导入到RNA沉默复合物中以切割互补的mRNA的方式起到调节基因表达的目的。miRNA的具体的产生以及作用方式如下图所示:

1.miRNA结构介绍

由上面的介绍我们知道miRNA是由可以折叠成茎环结构的的RNA产生的,由此我们可以想到只要预测基因组序列中可以折叠成茎环结构的区域就可以对miRNA进行预测了,但是只通过这一个标准来预测难免会带入太多的假阳性;我们又想到由于miRNA一般为21-22nt,所以miRNA的前体应该不会特别长,通过查阅文献得知miRNA的前体序列一般不超过300nt,那我们通过长度再次过滤是不是就可以了呢?答案是不行的,两个特征还是太少了。因此我们接着对miRNA的二级结构进行具体分析, 下图是拟南芥miRNA MIR399b的二级结构:

图中带颜色的部分是miRNA/miRNA* duplex, miRNA*是成熟miRNA的不完全互补链,在导入RNA沉默复合体中会被降解。由图中可以看出不管是miRNA还是miRNA*在其3‘端都有2个碱基的突出,因此这个特征可以作为另一个miRNA的评判标准;同时我们还能够看到miRNA/miRNA* duplex里是含有由于碱基不匹配而造成的突起,所以这个也是miRNA的一个评判标准;最后我们还看到miRNA/miRNA* duplex是存在错配的,通过查阅文献得知miRNA/miRNA*最多允许5个错配。通过以上5个标准我们就可以判断基因组中的一段序列是不是一个miRNA序列了。

2.深度测序鉴定miRNA的标准

由于二代测序的飞速发展,出现了通过二代测序来鉴定miRNA的方法,也就是通过sRNA-seq对小RNA进行测序来鉴定miRNA的策略,接着我们介绍一下通过二代测序鉴定miRNA的标准:

1. miRNA/miRNA* duplex在其3‘端有两个碱基的突出并且miRNA的前体长度不大于300nt。

2. 成熟的miRNA序列以及miRNA*序列只能由sRNA-seq来确定。

3.miRNA/miRNA* duplex包含不大于5个碱基的错配,并且最多只有一个非对称的突起,这个突起最多包含3个突起的核苷酸。

4.比对到预测前体上的sRNA-seq reads必须有75%的比例是精确的来自成熟的miRNA或者miRNA*,这些reads包含在miRNA和miRNA*序列上有一个错配的reads。

5.新鉴定的miRNA应该至少在两个sRNA-seq文库中按照标准被鉴定出来。

6.在 sRNA-seq中基于同源性鉴定miRNA也必须满足提到的所有的标准。

7.小于20nt或者大于24nt的sRNA不应该被注释成miRNA。

通过以上标准进行植物miRNA鉴定的软件有ShortStack以及miRDeep-P2, 下次我们在具体介绍这两款软件的使用方式。

参考文献:

Axtell, M.J., and Meyers, B.C. (2018). Revisiting Criteria for Plant MicroRNA Annotation in the Era of Big Data. Plant Cell 30, 272-284.

Jones-Rhoades, M., Bartel, D.P., and Bartel, B. (2006). MicroRNAs and Their Regulatory Roles in Plants. Annu. Rev. Plant Biol. 57, 19–53.

本文分享自微信公众号 - 生物信息学(swxxx1),作者:syliu

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-12-05

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 深入浅出介绍植物miRNA预测软件miRDP-2

    上期介绍了植物miRNA的鉴定标准, 通过这些标准就可以通过sRNA-Seq对植物的miRNA进行鉴定, 但自己通过写代码完成这个标准不仅费时费力,而且还会出现...

    阿凡亮
  • linux-两个文件求交集、并集、差集

    (用sort将a.txt b.txt文件进行排序,uniq使得两个文件中的行唯一,使用-d输出两个文件中次数大于1的内容,即是得到交集)

    阿凡亮
  • fasta序列按指定格式输出

    很多人应该遇到过需要将序列排列到一行上,或者每行按照规定的bp数显示。我也经常遇到像60bp,70bp的不等长fasta序列共存于同一个fasta文件中的情况,...

    阿凡亮
  • HMDD:miRNA相关疾病数据库

    HMDD是一个手工收集整理的miRNA与疾病相关联的数据库,最新版本为V3.0,网址如下

    生信修炼手册
  • microRNA简介

    转录本的类型是多种多样的,除了编码蛋白的RNA外,还有很多非编码蛋白的RNA, noncoding RNA, 简称ncRNA。 在ncRNA中,根据长度又分成两...

    生信修炼手册
  • miRTarBase:实验验证的miRNA靶基因数据库

    miRTarBase是一个手工收集的,经过实验验证过的miRNA靶基因数据库,网址如下

    生信修炼手册
  • miRTissue:一款miRNA-target-protein相互关系分析的神器

    microRNAs (miRNAs)是基因表达的主要调控因子,有多项研究表明其通过与靶基因的相互作用参与疾病的生理和病理过程。在癌症中,miRNAs的一个重要作...

    百味科研芝士
  • MicroRNA 的结构、生物合成及功能

    大多数miRNA位于mRNA宿主基因的内含子中,并共享调控元件、初级转录物,因此具有相似的表达模式。miRNA通过RNA聚合酶II被转录为名为pri-m...

    用户7627119
  • 如何预测miRNA靶基因(miRWalk2.0数据库)

    miRWalk2.0是miRWalk数据库的改进版本。 miRWalk2.0可以提供最全面的预测和实验验证的miRNA-mRNA相互作用,可以极大地帮助研究者对...

    用户1359560
  • oncomirdb:肿瘤相关的miRNA数据库

    oncomirdb通过文献检索的方式,从pubmed的多篇文献中收集整理出了肿瘤相关的miRNA信息,对应的文章发表在bioinformatics上,链接如下

    生信修炼手册

扫码关注云+社区

领取腾讯云代金券