前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >使用miRNAtap数据源提取miRNA的预测靶基因结果

使用miRNAtap数据源提取miRNA的预测靶基因结果

作者头像
生信技能树
发布2020-04-21 14:46:53
1.5K0
发布2020-04-21 14:46:53
举报
文章被收录于专栏:生信技能树生信技能树

前面我们分享了:microRNAs靶基因数据库哪家强,提到了综合了12个网页工具的miRWalk,以及整合了7个工具的miRSystem,但是最后我们仍然是推荐R包multiMiR作为提取miRNA的预测靶基因结果的解决方案,除了因为它综合了14个网页工具,而且还是这个月更新过,还有一个很大的原因是,我喜欢编程,喜欢R语言!

今天我们比较一下另外的一个miRNAtap包,与multiMiR的结果的一致性,以及两个数据库的差异!首先安装miRNAtap包,代码如下:

options(BioC_mirror="https://mirrors.tuna.tsinghua.edu.cn/bioconductor/")
options("repos" = c(CRAN="http://mirrors.cloud.tencent.com/CRAN/")) 
options(download.file.method = 'libcurl')
options(url.method='libcurl')

BiocManager::install("miRNAtap",ask = F,update = F)
BiocManager::install("topGO",ask = F,update = F)
BiocManager::install("miRNAtap.db",ask = F,update = F)

在miRNAtap包说明书很清楚的写着,它其实就是综合另外5个流行的数据源,然后总结一下,而且仅仅是支持人和鼠这两个物种哦!

首先看看,对指定的一个miRNA进行靶基因提取:

rm(list = ls())
library(miRNAtap)
library(topGO)
library(org.Hs.eg.db)
mir = 'miR-10b'
predictions = getPredictedTargets(mir, species = 'hsa',
                                  method = 'geom', min_src = 2)

head(predictions)
predictions_min = getPredictedTargets(mir, species = 'hsa',
                                      method = 'min', min_src = 2)
head(predictions_min)

两个总结5个数据库结果的方法差异在于靶基因的排名:

值得注意的是默认 是5个数据库都采用, i.e. c('pictar','diana','targetscan','miranda','mirdb'),不过也有可能某些miRNA在某些数据库其实是没有记录的。然后算法有3种:

min' is a minimum of ranks, 'max' is a maximum of ranks, and default 'geom'is based on geometric mean of the ranks which proves to be the most accurate method

所以我们就选择默认的geom即可,反正靶基因列表是一样的。

首先看miRNAtap包与multiMiR的结果的一致性

我们这里分别测试人和鼠的各一个miRNA,代码如下:

rm(list = ls())
library(miRNAtap)
library(topGO)
library(org.Hs.eg.db)
mir = 'hsa-miR-18a-3p'
tmp1 = getPredictedTargets(mir, species = 'hsa',
                           method = 'geom', min_src = 2)
head(tmp1) 
library(multiMiR)
example1 <- get_multimir(mirna = 'hsa-miR-18a-3p', summary = TRUE)
tmp2=example1@data
intersect(rownames(tmp1),tmp2$target_entrez)

mir = 'mmu-miR-9-5p'
tmp1 = getPredictedTargets(mir, species = 'mmu',
                           method = 'geom', min_src = 2)
library(multiMiR)
example1 <- get_multimir(mirna = mir, org = 'mmu',summary = TRUE)
tmp2=example1@data
table(tmp2$database)
intersect(rownames(tmp1),tmp2$target_entrez)

简单看了看,两个R包里面记录的同一个miRNA的靶基因重合度还挺高的!

再看看它与miRSystem网页工具结果的差异

进入 http://mirsystem.cgm.ntu.edu.tw/ ,粘贴我们的

值得注意的是,该工具顺便对靶基因进行了生物学功能数据库的注释

可以看到预测的靶基因是836个,有趣的是我们明明输入的是小鼠的miRNA,理论上靶基因应该是小鼠的,但是这个网页工具似乎是把人和鼠的基因模糊处理了.

同样的,检查可以看到miRSystem网页工具结果和R包也是约30%的重合。(因为不是这个领域,所以我并不清楚,不同数据库结果的30%左右的一致性是好还是坏)

既然是预测,就不可能多个工具完全一致,所以目前主流的做法是,选择5个以上数据库支持的靶基因作为该miRNA的最后列表。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-04-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 首先看miRNAtap包与multiMiR的结果的一致性
  • 再看看它与miRSystem网页工具结果的差异
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档