脚本简介:
SeqIO
模块读取 GBK 文件,自动解析注释信息和序列内容,确保提取位置准确。locus_tag
和 product
注释,便于后续分析和追踪来源。安装biopython模块:
# 使用pip安装
pip install biopython
# 使用conda安装
conda install -c bioconda biopython
查看脚本帮助文档:
python Gbk_extea_nucleotide.py -h
脚本使用方法:
1)脚本准备文件如下图所示
2)注意事项
-f
提供一个对应的基因组 FASTA 文件,脚本会从中提取 feature 对应的核酸序列;实战演习
# 提取CDS序列以及注释信息
python Gbk_extea_nucleotide.py -g NC_000913.gbk -t CDS -o NC_000913_cds.fnn
# 提取rRNA序列以及注释信息
python Gbk_extea_nucleotide.py -g NC_000913.gbk -t rRNA -o NC_000913_rRNA.fnn
# 提取tRNA序列以及注释信息
python Gbk_extea_nucleotide.py -g NC_000913.gbk -t tRNA -o NC_000913_tRNA.fnn
结果展示