前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >PLEK:转录本蛋白编码潜能预测工具

PLEK:转录本蛋白编码潜能预测工具

作者头像
生信修炼手册
发布2019-12-19 14:54:18
1.8K0
发布2019-12-19 14:54:18
举报
文章被收录于专栏:生信修炼手册生信修炼手册

欢迎关注”生信修炼手册”!

在之前的文章中,我们介绍过CPC和CNCI这两款软件,可以用于预测lncRNA序列。其中CPC基于序列比对的方式,对于注释信息相对全面的物种分类效果较好,但是运行速度相对较慢,CNCI基于序列的三联体碱基组成来区分编码和非编码转录本,对于注释信息缺乏的物种,效果也不错,但是当序列中存在插入缺失时,其分类效果就变得很差。

在高通量测序产生的数据中,会存在一定的测序错误,虽然比例很低,但是基于这样的序列组装得到转录本然后去预测lncRNA, 对于CNCI这个软件而言,就会造成相当大的影响。

为了克服上述问题,需要一款运行速度又快,又可以一定程度上降低测序错误影响的lncRNA预测软件,PLEK软件就是基于这样的出发点进行开发的。PLEK软件通过序列的kmer构成来区分编码和非编码转录本,不需要通过比对来完成,所以运行速度较快,同时其性能受到测序错误的影响的概率较低,比较稳定。

在论文中,开发者评估了测序错误对各个软件准确度的影响,结果如下所示

可以看到,随着测序错误比例的上升,CNCI的准确度急剧下降,而PLEK和CPC的结果都相对稳定。

同时利用小鼠的转录本数据,评估了各个软件分类的准确性,结果如下所示

从蛋白编码的转录本来看,CPC的准确率最高,PLEK误判的概率最高;从非编码转录本来看,CNCI的准确率最高,phyloCSF的误判率最高。

综合来看,PLEK的准确性介于CPC和CNCI之间,但是考虑到测序错误的影响,PLEK的优势会更加明显。

论文中对于各个软件的运行效率,也进行了比较,结果如下

可以看到PLEK的运行速度是最快的。该软件的源代码托管在sourceforge上,网址如下

https://sourceforge.net/projects/plek/files/

安装方式如下

代码语言:javascript
复制
wget https://sourceforge.net/projects/plek/files/PLEK.1.2.tar.gz
tar xzvf PLEK.1.2.tar.gz
cd PLEK.1.2
python PLEK_setup.py

基本用法如下

代码语言:javascript
复制
python PLEK.py \
-fasta transcript.fa \
-out output \
-thread 10

只需要输入转录本对应的fasta格式的文件就可以了,输出文件output内容示意如下

第一列代表该转录本为coding还是non-coding, 第二列为打分值,打分值大于0为coding, 小于零为non-coding, 第三列为fasta文件中的序列标识符。

默认情况下会调用内置的svm模型,如果你有该物种已知的mRNA和lncRNA转录本序列,也可以构建自己的模型,代码如下

代码语言:javascript
复制
python PLEKModelling.py \
-mRNA mRNAs.fa \
-lncRNA lncRNAs.fa \
-prefix 20190129

运行成功后,会生成后缀为.model.range的两个文件。在预测时可以通过参数指定svm模型,用法如下

代码语言:javascript
复制
python PLEK.py \
-fasta transcript.fa \
-out output \
-model 20190129.model
-range 20190129.range \
-thread 10

更多细节和用法请参考官方文档。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-01-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
代码托管
CODING 代码托管(CODING Code Repositories,CODING-CR)是为开发者打造的云端便捷代码管理工具,旨在为更多的开发者带去便捷、高效的开发体验,全面支持 Git/SVN 代码托管,包括代码评审、分支管理、超大仓库等功能。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档