我正在处理蛋白质的FASTA文件。我想使用python/biopython查找具有相似AA序列的蛋白质序列(在.txt文件中)。我试了很多,但找不到我错的地方。#using biopython
records=SeqIO.parse("protein.fasta") #to extract protein sequences from FASTA file
我正在寻找一种方法来读取Biopython中的.fasta文件,并有包估计,如果我们是处理脱氧核糖核酸,核糖核酸或蛋白质。file.fasta', 'r') as f: # do stuff, depending on alphabet
我的问题是现在我不知道我将在.fasta文件中找到什么样的序列。它可以是蛋白质、DNA或RNA
我有一个使用简并核苷酸序列的15聚核苷酸基序。实例: ATNTTRTCNGGHGCN。
我会搜索一组序列来寻找这个主题的出现。然而,我的其他序列都是精确序列,即它们没有歧义。我尝试在序列中执行一个for循环来搜索这个,但是我没有能够进行非精确的搜索。我使用的代码是根据上的代码建模的。for pos,seq in