我如何构建一个工具来帮助这个场景:
我在一个实验室工作,我们用质粒来表达重组蛋白。我们有一个数据库,其中包含了所有的质粒标识符和它们编码的蛋白质序列。
当需要一个新的蛋白质时,我希望能够输入新的所需的蛋白质序列,并在我们的数据库中搜索与该序列最接近的质粒,并获得最高的一致性评分。目的是使用该现有质粒,并将其作为新质粒的克隆模板。
换句话说,我想构建一个类似于NCBI blast的工具,它将在本地与SQL数据库中的专有序列一起工作。
Python能够做到这一点吗?
谢谢!
发布于 2022-04-21 18:52:33
用makeblastdb
创建自己的本地BLAST数据库怎么样?然后你可以使用这样的东西:
from Bio.Blast.Applications import NcbiblastnCommandline
run_command = NcbiblastnCommandline(query=YOUR_SEQUENCE_FASTA_PATH,
db=DATABASE_PATH,
out=RESULT_PATH,
outfmt=5,
[… other parameters …],
evalue=1e-10
)
stdout, stderr = run_command()
https://stackoverflow.com/questions/71957115
复制相似问题