文章/答案/技术大牛

发布

社区首页 >问答首页 >如何比较蛋白质序列以找到最接近的匹配

问如何比较蛋白质序列以找到最接近的匹配
EN

Stack Overflow用户

提问于 2022-04-21 15:32:02

回答 1查看 126关注 0票数 2

我如何构建一个工具来帮助这个场景：

我在一个实验室工作，我们用质粒来表达重组蛋白。我们有一个数据库，其中包含了所有的质粒标识符和它们编码的蛋白质序列。

当需要一个新的蛋白质时，我希望能够输入新的所需的蛋白质序列，并在我们的数据库中搜索与该序列最接近的质粒，并获得最高的一致性评分。目的是使用该现有质粒，并将其作为新质粒的克隆模板。

换句话说，我想构建一个类似于NCBI blast的工具，它将在本地与SQL数据库中的专有序列一起工作。

Python能够做到这一点吗？

谢谢！

sequence

bioinformatics

identity

protein-database

alignment

回答 1

Stack Overflow用户

回答已采纳

发布于 2022-04-21 18:52:33

用makeblastdb创建自己的本地BLAST数据库怎么样？然后你可以使用这样的东西：

from Bio.Blast.Applications import NcbiblastnCommandline

run_command = NcbiblastnCommandline(query=YOUR_SEQUENCE_FASTA_PATH,
                                    db=DATABASE_PATH,
                                    out=RESULT_PATH,
                                    outfmt=5,
                                    [… other parameters …],
                                    evalue=1e-10
                                   )

stdout, stderr = run_command()

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/71957115

复制

相似问题

问如何比较蛋白质序列以找到最接近的匹配
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何比较蛋白质序列以找到最接近的匹配EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何比较蛋白质序列以找到最接近的匹配
EN