首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

第七课 送ncRNA数据库偶!

我们的R语言学习已经有一阵了,我们了解了R的安装,Rstudio集成平台的安装及界面设置,Rstudio的界面及快捷键,R的内置数据集。

今天是周末,我们把之前的课程消化一下。

针对医生、医学生、医药相关的科研工作者,我们今天送一些数据库,大家可以通过对数据库的学习找到自己感兴趣的基因和通路,等我们学完R就可以将这些基因或者通路的箱状图、通路图绘制出来。

传统意义上的医学研究焦点主要定位在编码RNA及蛋白,随着二代测序技术的应用,甚至普及,我们发现了越来越多的非编码RNA,基因组研究过程中,发现大量不编码蛋白质的重复序列,一度被称为“垃圾”,该物质越是在高等生物中含量越多。

研究所有上述各种RNA的时空表达情况及其生物学意义,将在全面破解生命奥秘中发挥重要作用。中外科学家都注意到了以此为研究对象的RNA组学问题。

非编码RNA( Non-coding RNA,ncRNA)

编码蛋白序列基因占基因组的2-3%,基因组的转录水平≧90%,其中绝大部分的转录产物是ncRNA。物种间最主要的差别也是ncRNA。

那么什么是非编码RNA?

1.包括rRNA,tRNA,snRNA,snoRNA和miRNA等多种已知功能的 RNA,还包括未知功能的RNA。

2.能从基因组上转录而来,但是不翻译成蛋白,在RNA 水平上就能行使各自的生物学功能。

3.人基因组中有30亿个碱基对,其中1.5%能够编码蛋白质,98.5%是非蛋白质编码基因,这些基因序列一度被认为是“垃圾”基因。

ncRNA的作用有哪些?

1.影响染色体的结构。

2.调控转录。

3.参与RNA的加工,修饰。

4.参与mRNA的稳定和翻译调控过程。

5.影响蛋白质的稳定和转运。

6.在植物适应环境胁迫中的调控作用。

7.在细胞发育和分化中的调控作用。

miRNA特点?

1.广泛存在于真核生物中的一组短小的,不编码蛋白质的RNA家族。

2.由19-23个核苷酸组成的单链RNA(3‘端可有1~2个碱基长度的变化)。

3.表达具有组织特异性和阶段特异性。即:在不同组织中表达有不同类型的miRNA,在生物发育的不同阶段里有不同miRNA表达。

4.与靶mRNA 3\'-UTR结合,序列特异性在转录后水平调控基因的翻译表达,在生物发育、脂肪代谢、细胞分化、增殖和凋亡等过程中对着重要作用。

5.miRNA具有高度保守性,即各种miRNA都能在其它种系中找到同源体。

miRNA独有的特征:

其5’端第一个碱基对U有强烈倾向性,而对G却有抗性;

第二到第四个碱基缺乏U,除第四个碱基外,其他位置碱基通常都缺乏C;miRNA执行一定的生物学功能:对与其互补的mRNA表达水平具有调节作用;一些偏大的miRNA(27nt)可能参与了基因组的重组装;参与生物的发育与多种生理,病理进程。

听到这里会有人说,miRNA研究好多,是不是不容易发paper和申请课题了,错了,发paper尤其是高分paper需要的是创新,证件确凿的,miRNA更容易研究,关键你的切入点是否新颖,能否解决关键问题。

最近的《Cell Chemical Biology》杂志发表了一篇文章,发现目前大多数药物均存在潜在的非编码RNA结合位点,这也许会带来一场新的miRNA研究革命,这些药物的疗效在不同个体结果千差万别,难道只是SNP的原因,也许就和这些miRNA有关。

那么如果你的课题是ncRNA方向,今天我们送几个数据库给大家!

mirbase的主界面,miRBase序列数据库是一个提供包括已发表的miRNA序列数据、注释、预测基因靶标等信息的全方位数据库,是存储miRNA信息最主要的公共数据库之一。怎么用这个数据库,举个例子。

我们预测miRNA的靶基因,例如hsa-mir-1296,我们输入标准的名字,就会自动出现相应的miRNA,hsa提示物种是人类。

点击Go,就会出现hsa-mir-1296的相应信息。

点击Get sequence,得到miRNA-1296-5p的序列。

>hsa-miR-1296-5p MIMAT0005794

UUAGGGCCCUGGCUCCAUCUCC

然后我们看看这个基因的结构,进入另一个数据库,http://rna.urmc.rochester.edu/RNAstructureWeb/

界面是这样的,选择Predict a secondary structure,首先给这个预测结果起个名字,我们姑且就叫它>mir-1296,然后在下面方框里输入刚才我们查找到的序列,因为这个mir是RAN,所以我们选择RNA。

参数默认,最后点击Submit Query,稍微等待一会,出现了我们想要的结果。

这个结构就预测出来啦,哦对了我们还要找靶基因。用TargetScan网站吧。

输入物种,miRNA名字,点击Submit就OK了。

1724条靶基因,一般我们多用几个数据库找靶基因,然后取交集,这个工作可以交给R做韦恩图,什么是韦恩图,怎么做?在我们后续课程都会讲到,并且赠送源代码,今天周末咱就别学R了,歇两天哈!

大家可以下面扫二维码,在代码栏里下载miRNA常用数据库、lncRNA常用数据库、circleRNA常用数据库,以后我们慢慢学习其他数据库的使用,lncRNA有一个数据库我当时自学的时候一夜没睡,早晨6点整明白了。

扫二维码关注,点击“代码”中的代码即可获得偶~!

这里领我们整理的软件库

这里查看sci文章润色服务

这里看R界传奇老司机直播录像

这里进免费免安装的文献下载神器

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180901B0C2OM00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券