前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >宏基因组基因预测

宏基因组基因预测

作者头像
生信喵实验柴
发布2023-02-24 13:20:48
6590
发布2023-02-24 13:20:48
举报
文章被收录于专栏:生信喵实验柴

一、基因预测

Prokka: rapid prokaryotic genome annotation,prokka 是一个命令行软件工具,可以在一台典型台式机上在约 10 分钟内充分注释一个细菌基因组草图。它产生标准兼容的输出文件以进行进一步分析或者在基因组浏览器中查看。prokka 是一个分析流程,里面包含了很多软件,依赖关系众多,不同软件又涉及到版本问题,还需要使用很多 perl 模块,这里强烈建议使用功能 bioconda 虚拟环境来进行安装。

软件官网:http://www.vicbioinformatics.com/software.prokka.shtml

二、软件安装

代码语言:javascript
复制
conda create -n prokka -y
conda activate prokka
conda install -y prokka

三、使用案例

prokka 的使用比较简单,只需要输入一个 fasta 格式的序列即可,因为拼接好的基因组数据量不大,很快就可以运行完成。

代码语言:javascript
复制
cp ../2/nanopore/flye/assembly.fasta mg.fasta
echo "time prokka mg.fasta --outdir prokka --prefix mg --metagenome --kingdom Archaea,Bacteria,Mitochondria,Viruses 1>prokka.log 2>prokka.err" >prokka.sh
bsub -q fat -n 8 -o %J.log -e %J.err sh prokka.sh

选项参数:

--outdir:输出结果目录

--prefix :输出结果前缀

--metagenome:标记,输入数据为宏基因组序列

--kingdom:处理哪些样品 Archaea|Bacteria|Mitochondria|Viruses

--gcode:密码子表

--setupdb:自动搜索并添加数据库

--listdb:测序数据库

--depends:列出依赖的软件

四、结果解读

扩展名

释义

gff

基因注释文件,包括 gff 和序列,可用 igv 直接查看

gbk

Genebank 格式,来自 gff

fna

输入 contig 核酸文件

faa

基因的氨基酸序列

ffn

基因的核酸序列

sqn

用于提交的序列

fsa

输入序列,但有 sqn 的描述,用于 tbl2asn 生成 sqn 文件

tbl

特征表,用于 tbl2asn 生成 sqn 文件

err

软件运行错误日志

log

软件运行日志

txt

统计结果

tsv

所有注释基因特征表格

写在最后:有时间我们会努力更新的。大家互动交流可以前去论坛,地址在下面,复制去浏览器即可访问,弥补下公众号没有留言功能的缺憾。

代码语言:javascript
复制
bioinfoer.com

有些板块也可以预设为大家日常趣事的分享等,欢迎大家来提建议。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-12-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信喵实验柴 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档