前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >NONCODE:综合性的lncRNA数据库

NONCODE:综合性的lncRNA数据库

作者头像
生信修炼手册
发布2019-12-19 14:45:11
1.1K0
发布2019-12-19 14:45:11
举报
文章被收录于专栏:生信修炼手册

欢迎关注”生信修炼手册”!

NONCODE数据库是一个综合的非编码RNA数据库,该数据库中包含了除tRNA和rRNA之外的其他类型的非编码RNA信息,其中绝大部分是lncRNA,网址如下

http://www.noncode.org/index.php

目前最新版本为v5, 共包含了17个物种的非编码RNA, 物种和对应的lncRNA数量汇总如下

该数据库通过两个途径收集和整理非编码RNA信息,第一种是通过pubmed进行文献检索,以ncrna, non-coding等关键词检索,然后从文章中提取非编码RNA;第二种是通过已有的数据库,比如RefSeq, GENCODE, lncRNAdb等。

将收集到的所有非编码RNA以gtfbed格式进行记录,通过compare合并相同转录本,去冗余,对去冗余只有的转录本和基因赋予NONCODE的ID; 然后利用CNCI预测其蛋白编码潜能,只保留CNCI预测结果为non-coding的转录本。

以上可以得到非编码RNA的基本信息,除此之外,还提供了在不同组织或者细胞系中的表达谱,功能预测,在不同物种间的保守性, 相关疾病等注释信息,人类的非编码RNA表达谱从Human BodyMap2.0 项目和GSE30554两个项目中得到;小鼠的表达谱数据从ERP000591得到,lncRNA的功能预测结果通过lnc-GFP这个软件预测得到。

通过Browse DB, 可以查看数据库中每个非编码RNA的信息,示意如下

NONCODE数据库的转录本ID以NON开头,后面三个字母代表物种,比如human对应HSA, 接下来的T代表转录本,后面的数字编号用于区分不同转录本; 对于每个转录本,给出了染色体位置,外显子个数,长度,CNCI score等信息。

点击每个转录本ID, 可以查看详细信息,除了序列等基本信息外,还包括以下两种信息

1. 表达谱
2. 二级结构

通过Function菜单,可以检索得到lncRNA对应的Go注释, 结果示意如下

lncRNA对应的GO注释是通过ncFANS这个在线网站得到的。

通过Disease菜单,可以检索到得到lncRNA相关的疾病和突变信息,示意如下

官网还提供了iLncRNA工具,用于预测lncRNA, 示意如下

只需要上传转录本对应的GTF文件或者BED文件就可以了。

对于所有物种的lncRNA, 提供了fastabed两种格式供下载,对于常见的human, mouse, rat, 还提供了gtf格式的文件。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-01-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 表达谱
  • 2. 二级结构
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档