前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >超简便的国产lncRNA预测工具LGC

超简便的国产lncRNA预测工具LGC

作者头像
生信宝典
发布2019-05-09 11:13:34
2K0
发布2019-05-09 11:13:34
举报
文章被收录于专栏:生信宝典生信宝典

在过去几年里,研究发现long non-coding RNAs (lncRNAs)在疾病和生物调控过程中扮演着重要角色。但在大量非模式物种中lncRNA的鉴定仍是一项富有挑战性的工作。该工作需要确定的序列信息,注释信息以及构建物种特有的训练集,但具有lncRNA研究所需的足够完整的序列与注释的物种只占很少数。

LGC是由北京基因组所基于python2 (Python极简教程(一))开发的一款快速lncRNA预测工具,该工具通过ORF(开放阅读框)长度和GC含量间的关系进行相关运算来鉴定lncRNA。LGC最大特点是能够基于跨物种策略进行lncRNA发掘。因此LGC可以支持有参数据无参数据 (无参转录组分析工具评估和流程展示)进行lncRNA鉴定。在区分从植物到哺乳动物的不同物种的lncRNA和蛋白编码RNA方面,LGC鉴定的准确率高达90%

LGC基于物种特异性模型和人类模型性能研究

LGC与现有常见lncRNA鉴定工具准确性敏感性特异性评估

LGC提供了在线服务器版和Linix/Unix本地版 (如果您也开发了软件,希望同时做个线上版,欢迎联系我们开发,专业服务,质优价廉,也投个核酸研究)

Webserver

(http://bigd.big.ac.cn/lgc/calculator)

漂亮简洁的应用页面,只需要fasta(无参有参数据都可用)序列就可以进行lncRNA鉴定(可以直接粘贴自己感兴趣的序列或上传fasta文件(文件小于100MB)进行批量鉴定)。另外对人类,果蝇,小鼠,斑马鱼四个物种可以通过上传BED(小于3MB)或GTF(小于3MB)格式文件进行lncRNA挖掘。生信分析过程中这些常见文件的格式以及查看方式你都知道吗?

本地运行

当然,网页版在速度与通量上仍有一定的局限性(对原始fasta数据库的拆分,再逐批上传鉴定真的好麻烦)。如果分析的数据比较多,可以在linux服务器搭建本地版本进行全库的LncRNA检索。 (不熟悉Linux,来看看免费Linux系统和生信宝典原创学习教程

在构建本地版的LGC时,LGC官网推荐的安装流程是先安装python2biopython,但我个人习惯使用anaconda2以及其下的bioconda解决生物软件安装烦恼),可以大大简化安装过程和更好的解决依赖性问题(conda install 想补什么补什么,Linux - Conda软件安装方法)。

命令如下

代码语言:javascript
复制
wget http://bigd.big.ac.cn/biocode/tools/4/releases/1.0/file/download?filename=lgc-1.0.tar.gz
tar zxf lgc-1.0.tar.gz
chmod 755 lgc-1.0.py
#确保conda,lgc-1.0.py在环境变量里
lgc-1.0.py input.fasta output.txt 
# Or
python lgc-1.0.py input.fasta output.txt

结果文件各列的意义

这样,我们就可以通过设置合理的筛选条件,来筛得感兴趣的lncRNA进行后续的研究,比如:

参考资料:

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-02-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信宝典 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Webserver
  • 本地运行
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档