
获得miRNA之后就需要尝试去预测它们的作用靶点了,一般我们会采用多数据库整合分析,这次先介绍一下ENCORI数据库,这个数据库的优势之一在于它已经整合了多个数据库的数据。
ENCORI (The Encyclopedia of RNA Interactomes) 是一个集成数据库,主要致力于提供 RNA 分子间的互作信息,尤其是 miRNA、lncRNA、mRNA 等之间的互作数据。

本次我们尝试去找到miRNA与mRNA作用的信息。

左侧界面可以输入需要检索的microRNA分子,右侧可以把数据完整的下载下来。

开发者还提供了网页接口,可以一次性下载大量数据。如果需要把全部数据都下载下来需要修改一下参数,这些参数包括:

打开终端,创建脚本,路径自定哈
# 创建脚本
nano ENCORI.sh把内容贴上去
#!/bin/bash
# 定义所需的预测程序
programs=("PITA" "RNA22" "miRmap" "DIANA-microT" "miRanda" "PicTar" "TargetScan")
# 循环下载每个程序的数据
for prog in "${programs[@]}"
do
# 使用curl下载数据,并保存到相应的文件
curl "https://rnasysu.com/encori/api/miRNATarget/?assembly=hg38&geneType=mRNA&miRNA=all&clipExpNum=5°raExpNum=0&pancancerNum=0&programNum=1&program=${prog}&target=all&cellType=all" > "ENCORI_hg38_CLIP-seq_${prog}.txt"
done运行
bash ./ENCOR.sh文件不大,下载挺快的

1.导入
rm(list = ls())
# 其中DIANA-microT中没有数据,因此整合的时候需要删去
programs <- c("PITA","RNA22","miRmap",# "DIANA-microT",
"miRanda","PicTar","TargetScan")2.数据预处理
data_list <- list()
for (i in programs) {
# 读取文件并保存到 R 环境中的不同变量
data <- read.delim(paste0("ENCORI_hg38_CLIP-seq_", i, ".txt"),
sep = "\t", quote = "", row.names = NULL, comment.char = "#")
# 使用 assign() 函数创建动态变量名
assign(paste0("data_", i), data)
# 将数据和列名分别保存到列表中
data_list[[i]] <- data
}
# check数据
data_list[["PITA"]][1:4,1:4]
# miRNAid miRNAname geneID geneName
# 1 MIMAT0000062 hsa-let-7a-5p ENSG00000116237 ICMT
# 2 MIMAT0000062 hsa-let-7a-5p ENSG00000173641 HSPB7
# 3 MIMAT0000062 hsa-let-7a-5p ENSG00000244038 DDOST
# 4 MIMAT0000062 hsa-let-7a-5p ENSG00000007968 E2F2之后就可以筛一筛数据做一做韦恩图啦

公众号输入关键词:241019 ,即可得到下载后的ENCORI-miRNA数据(30天)
注:若对内容有疑惑或者有发现明确错误的朋友,请联系后台(欢迎交流)。更多内容可关注公众号:生信方舟
- END -
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。