前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >三种方法提取miRNA成熟体序列

三种方法提取miRNA成熟体序列

作者头像
生信交流平台
发布2022-09-21 14:40:56
1.1K0
发布2022-09-21 14:40:56
举报
文章被收录于专栏:用户7627119的专栏

前面我们讲过☞miRNA靶基因预测☜,我们知道miRNA靶基因预测一般是通过seed(种子序列)与靶基因序列互补配对来实现的。有很多本地版本的软件都是基于这个原理来预测miRNA靶基因的,例如☞targetscanmiRandaRNAhybrid等等。这些软件都有本地版本,可以下载到自己的电脑上运行。一般输入都是两个文件,一个是miRNA的成熟体序列,因为miRNA的种子序列一般位于miRNA成熟体5‘的2-7位(参考☞miRNA靶基因预测☜),另外一个输入文件就是你要预测的靶基因序列了,这里的靶基因序列可以是mRNA 3’UTR序列,也可以是lncRNA或者circRNA序列。

那么今天我们就来给大家分享一下如何获取miRNA的成熟体序列。首先我们去miRbase(http://www.mirbase.org/ftp.shtml)数据库下载目前所有物种的miRNA成熟体序列文件mature.fa。关于miRbase的介绍可以参考☞miRBase数据库介绍及miRNA数据下载

mature.fa打开内容如下

接下来我们给大家分享三种不同的方法来提取感兴趣的物种的miRNA成熟体序列

1. perl语言

代码语言:javascript
复制
#!/usr/bin/perl  -w

#打开包含所有物种miRNA成熟体序列的文件
open FILE,"mature.fa";
#新建一个输出文件,保存人的所有miRNA成熟体序列
open OUT,">hsa_mature_seq.fa";
#循环的读取每一行内容
while($line=<FILE>){
 chomp($line);
 #如果某一行匹配>hsa开始,证明这是人的miRNA
 #如果对其他物种感兴趣,需要知道这个物种的miRNA以什么开头,如小鼠的是mmu
 if($line=~/(^>hsa.*?) /){
 #读取下一行就是对应的miRNA成熟体序列
  $seq=<FILE>;
  chomp($seq);
  #写到输出文件中
  print OUT "$1\n$seq\n";
 }
}
#关掉输入和输出文件
close FILE;
close OUT;

hsa_mature_seq.fa文件打开内容如下

2. R语言

代码语言:javascript
复制
#安装Biostrings这个R包
BiocManager::install("Biostrings")
#加载Biostrings这个包
library("Biostrings")
#读取包含所有物种miRNA成熟提序列的文件
mir=readRNAStringSet("mature.fa")
#替换序列名字,只保留第一个空格前面的内容
#>cel-let-7-5p MIMAT0000001 Caenorhabditis elegans let-7-5p
#替换之后变成了>cel-let-7-5p
names(mir)=gsub(" .*$","",names(mir))

#提取以hsa开头的miRNA,如果对其他物种感兴趣
#需要知道这个物种的miRNA以什么开头,如小鼠的是mmu,人的是hsa
index=grepl("^hsa",names(mir))
#提取相应的序列
hsa=mir[index]
#写出到human_mature_mir_seq.fa文件中
writeXStringSet(hsa, "human_mature_mir_seq.fa")

human_mature_mir_seq.fa文件打开内容如下

3. 利用EmEditor正则表达式来提取miRNA的成熟体序列

http://mpvideo.qpic.cn/0bf2siaawaaanuafmucp5fqfbewdbojaacya.f10002.mp4?

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-03-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信交流平台 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档