前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >处理ENCORI预测的miRNA-circRNA结果

处理ENCORI预测的miRNA-circRNA结果

作者头像
生信交流平台
发布2022-09-21 18:58:12
9000
发布2022-09-21 18:58:12
举报
文章被收录于专栏:用户7627119的专栏

前面给大家详细的介绍过ENCORI这个数据库,相信很多小伙伴也已经使用过这个工具了

RNA相互作用神器——ENCORI

☞starbase(ENCORI)数据库介绍(一)

R批量预测miRNA和靶基因之间的调控关系-ENCORI篇

☞零代码生存曲线—ENCORI篇

☞miRNA数据库简介及miRNA靶基因批量预测

最近有小伙伴反映,使用这个数据库预测的miRNA-circRNA调控关系的结果中geneName这一列有些显示的是标准的circRNA的ID号,但是大多数显示的都是基因名字。怎么样才能让这一列全部显示circRNA的ID号呢?

前面我们也给大家讲解过怎么样用代码批量下载miRNA靶基因的结果

☞R下载合并ENCORI miRNA靶基因数据

用代码下载下来的结果,你会发现跟直接从网页上下载的结果不太一样,似乎多了一列circID,而这一列正式我们需要的circID,里面全部是标准的circRNA的ID号。

但是这里又有一个问题,一个miRNA可以同时靶向多个circRNA,所以有些行里面会出现多个circRNA ID,用逗号隔开。这种格式是没办法直接作为cytoscape的输入文件的。前面给大家介绍过

cytoscape构建ceRNA网络的输入文件如何制作

我们知道如果要构建ceRNA网络,cytoscape的边的文件格式必须是下面这种,一对一的关系,而不能是一对多的关系

那么接下来小编就来教大家把一对多转换成一对一的关系

代码语言:javascript
复制
#读入miRNA靶基因预测結果,跳过前四行
a=read.table("ENCORI_hg19_miRNATarget_hsa-miR-25-3p_all_all.txt",sep="\t",stringsAsFactors = F,skip=4)
#提取第二列miRNAname和第五列circID,
b=a[,c(2,5)]
#给b添加列名
names(b)=c("mir","circ")
#将circID列,按照,拆分开,然后强制转换成向量
circs=unlist(strsplit(b$circ,","))
#构建miRNA-circRNA一对一的关系,mir都是相同的hsa-miR-25-3p,长度跟circ向量的长度一样
#第一列为miRNA名字,第二列为circRNA的名字
result=data.frame(mir=rep(unique(b$mir),length(circs)),circ=circs)
#去除一下冗余
result_rmdp=unique(result)
#保存結果到miRNA_circ.txt中
write.table(file="miRNA_circ.txt",result_rmdp,quote=F,row.names = F,sep="\t")

最后我们得到的结果是这样的

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-01-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信交流平台 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档