Biopython，如何仅打印序列的文本？_如何使用Biopython查找蛋白质的核苷酸序列？_如何仅打印匹配的模式 - 腾讯云开发者社区

bioinformatics、biopython、ncbi、biojava

谁知道如何使用BIopython或BioJAVA从FTP ncbi中自动搜索和解析gbk文件。我在BIojava中搜索了实用程序，但没有找到任何实用程序。我也尝试过BioPython，下面是我的代码： from Bio import Entrez Entrez.email = "test@yahoo.com" Entrez.tool = "MyLocalScript" handle = Entrez.esearch(db="nucleotide", term="Mycobacterium avium[Orgn]") record

浏览 22提问于2014-03-14得票数 1

1回答

biopython集群的简单示例

python、cluster-analysis、biopython

我想对如何使用biopython进行基因聚类有一些基本的了解。假设我有想要分组的基因。如何将它们提供给算法，以及如何给出一个截止点，在该截止点下聚类的大小和数量将取决于？我尝试过简单的方法： from Bio.Cluster import kcluster list1 = [ 'ADHAMKCAIROSURBANDJVUGLOBALIZATIONANDURBANFANTASIESPLA', 'AGGESTAMKTHEARABSTATEANDNEOLIBERALGLOBALIZATIONTHEARAB', 'AGGESTAM

浏览 15提问于2017-07-27得票数 1

回答已采纳

1回答

使用BioPython更改FASTA文件中的记录id

bioinformatics、biopython

我有以下FASTA文件，original.fasta >foo GCTCACACATAGTTGATGCAGATGTTGAATTCACTATGAGGTGGGAGGATGTAGGGCCA 我需要将记录id从foo更改为bar，所以我编写了以下代码： from Bio import SeqIO original_file = r"path\to\original.fasta" corrected_file = r"path\to\corrected.fasta" with open(original_file) as original, open(corre

浏览 2提问于2015-09-01得票数 2

回答已采纳

2回答

使用Clustal打印每行的50个序列

parsing、biopython、clustal

我有一个多序列比对(Clustal)文件，我想读取这个文件，并以这样一种方式排列序列，使其在顺序上看起来更清晰和精确。我在Biopython中使用AlignIO对象执行此操作： alignment = AlignIO.read("opuntia.aln", "clustal") print "Number of rows: %i" % len(align) for record in alignment: print "%s - %s" % (record.id, record.seq) 看起来乱七八糟，滚动起来很长

浏览 5提问于2010-05-22得票数 0

回答已采纳

3回答

如何编写字符串算法

python、bioinformatics、biopython、string-algorithm、rosalind

给定一个FASTA文本文件(Rosalind_gc.txt)，我应该检查每个DNA记录并确定鸟嘌呤胞嘧啶(GC)含量的百分比(%)。这方面的示例如下：样本数据集： >Rosalind_6404 CCTGCGGAAGATCGGCACTAGAATAGCCAGAACCGTTTCTCTGAGGCTTCCGGCCTTCCC TCCCACTAATAATTCTGAGG >Rosalind_5959 CCATCGGTAGCGCATCCTTAGTCCAATTAAGTCCCTATCCAGGCGCTCCGCCGAAGGTCT ATATCCATTTGTCAGCAGACACGC >Ros

浏览 22提问于2019-05-30得票数 0

1回答

Entrez -搜索结果与在线结果不匹配

bioinformatics、biopython

我正在使用下面的代码来执行搜索，但是我从IdList获得的I与在线搜索中的I不匹配。 from Bio import Entrez Entrez.email = "myEmail@gmail.com" handle = Entrez.esearch(db = "nucleotide", term = "chordata[orgn] AND chromosome", retmax = 10, idtype = "acc") genome_ids = Entrez.read(handle)['IdList'] pri

浏览 0提问于2018-06-03得票数 1

1回答

肌肉命令行包装器

python、command-line-interface、bioinformatics、biopython

我试图使用python来完成多序列对齐。我正在使用biopython模块作为基础，但是用于biopython的命令行包装器意味着语法： from Bio.Align.Applications import MuscleCommandline muscle_exe = r"path\muscle.exe" in_file = r"path\Example.fasta" out_file = r"Path\Examplealn.fasta" muscle_cline = MuscleCommandLine(input=i

浏览 2提问于2022-01-19得票数 1

1回答

没有基因组序列的GBK文件的Biopython解析

python、biopython、genbank

我编写了一个脚本，它使用GenBank文件和Biopython从GBK文件的序列部分获取给定基因的序列，我的同事在他们的工作中使用该序列。我们现在在一个新的数据集上遇到了一些问题，结果是下载的GBK文件没有包含序列(从NCBI的GenBank网站下载时很容易发生这种情况)。Biopython没有抛出错误，而是在使用record.seq[start:end]时返回很长的Ns序列。从一开始就抓住这个问题的最简单的方法是用错误消息停止脚本吗？

浏览 4提问于2014-08-28得票数 0

回答已采纳

2回答

将FASTA转换为GenBank

biopython、fasta、genbank

有没有一种方法可以使用BioPython将FASTA文件转换成Genbank格式？关于如何从Genbank转换到FASTA，有很多答案，但不是相反的。

浏览 4提问于2015-05-12得票数 6

5回答

来自uniprot Protein id python的蛋白质序列

python、bioinformatics、biopython

我想知道是否有方法可以从uniprot蛋白质ids中获得蛋白质序列。我确实检查了几个在线软件，但他们允许一次获得一个序列，但我有5536个vlues。在biopython中有没有可以做到这一点的包？

浏览 2提问于2018-09-29得票数 4

1回答

Biopython中与BioPerl的Bio::DB::Fasta等效的函数是什么？

python、perl、biopython、bioperl

我正在使用BioPython将Perl代码转换为Python代码。我得到了类似这样的东西： my $db = Bio::DB::Fasta->new($path,$options) 我正在寻找Biopython中类似的函数。有像这样的东西吗？

浏览 18提问于2016-09-09得票数 1

回答已采纳

1回答

从fasta文件估计Biopython中的字母表

python、bioinformatics、biopython、fasta

我正在寻找一种方法来读取Biopython中的.fasta文件，并有包估计，如果我们是处理脱氧核糖核酸，核糖核酸或蛋白质。到目前为止，我像这样读取数据： with open('file.fasta', 'r') as f: for seq in sio.parse(f, 'fasta'): # do stuff, depending on alphabet 我的问题是现在我不知道我将在.fasta文件中找到什么样的序列。它可以是蛋白质、DNA或RNA，但我必须知道字母表中的字母数。有没有办法用Biopython从序列中“

浏览 16提问于2017-01-11得票数 4

回答已采纳

1回答

如何将序列修剪或填充成一定长度的bio python

python、bioinformatics、biopython

有什么最简单的方法来修剪或填充一组biopython fastfa文件，直到它们都达到一定的长度，以便我可以将它们添加到多个序列比对中？类似于这里的答案，除了多个序列，没有文本文件，最后它都应该被合并到一个多序列比对中。最终目标是所有序列都是570个字符。我打算将所有这一切合并成一个门类树。

浏览 15提问于2019-12-01得票数 0

1回答

解析多fasta文件以提取序列

python、fasta

我试图用python编写一个脚本来解析一个大型的fasta文件，因为我正在学习脚本，所以我不想使用biopython。脚本需要将登录号、序列长度和序列gc内容打印到控制台。我已经能够提取登录号，但无法提取序列，因为它们被读取为行，这使我无法计算序列长度和gc内容。有人能帮我吗？我尝试在列表中对行进行分组，但是这会在一个列表中创建多个列表，我也不知道如何加入它们。 seq="" seqcount=0 seqlen=0 gc=0 #prompt user for file name infile=input("Enter the name of your designa

浏览 1提问于2017-10-18得票数 3

1回答

从Python中的fasta文件中删除第一条记录

python、python-2.7、biopython

我有一个小的fasta文件，格式如下： >gene_1 + other data seq 1 >gene_1 + other data seq2 >gene_1 + other data seq3 我想删除文件的第一个元素。这是一个大型Python脚本的一部分，一旦我使用了这个seq，并提取了其中有趣的部分，我想从文件中删除它。最后，文件将被清空，这样我就可以从文件夹中删除它。因为我一直在使用Biopython，所以我想看看是否可以在Biopython中找到函数，但是我找不到任何关于如何从fasta文件中删除记录的提示。由于SeqIO有一种列表，所以我尝试使用list.rem

浏览 2提问于2017-09-25得票数 0

回答已采纳

5回答

Python-从fasta文件中寻找最长的序列？

python

我需要做一个程序，打印出fasta文件中最长序列的名称和长度。 (注意:这是一个示例文件，我需要编写一个程序来支持fasta文件中的任意数量的序列) 所以我还是一个python的初学者，所以我不知道打开文件之类的技巧。我打算把它当作一个普通的文本文件，打开它并将其转换成一个列表。我纠结于如何获得第一个序列的长度等等，但我不知道如何才能获得其他序列的长度，并有效地比较它们。 file = open('fasta.txt','r') file = file.read().split('\n') 有人能帮我开始吗？我就是在这个问题上找不到立足点。再

浏览 23提问于2015-04-30得票数 2

1回答

Ubuntu上的ClustalW

python、ubuntu、bioinformatics、biopython

在biopython的食谱中，我找不到如何实际运行clustalw。我已经完成了食谱上的操作，但它没有运行clustalw，只是打印出来了 clustalw2 -infile=opuntia.fasta 有没有人能教我如何实际运行clustalw

浏览 0提问于2018-09-13得票数 1

1回答

读取用户输入的.fasta文件并使用Biopython进行解析？

python、bioinformatics、biopython、fasta

我正在尝试创建一个python脚本，用户可以在其中键入他们的FASTA文件，然后该文件将使用Biopython进行解析。我正在努力让它工作。到目前为止，我的脚本是这样的： #!/usr/bin/python3 file_name = input("Insert full file name including the fasta extension: ") with open(file_name, "r") as inf: seq = inf.read() from Bio.SeqIO.FastaIO import SimpleFastaParser c

浏览 1提问于2018-12-03得票数 0

2回答

AlignIO在FASTA文件中找不到记录

python、biopython

我想开始使用Biopython来对齐序列文件，但是库总是给我错误。我的代码如下： from Bio import AlignIO import Bio alignment = AlignIO.read("A_prot.fasta","fasta") print alignment 我确保将A_prot.fasta放在与我的程序相同的目录中，但我收到一个错误消息： Traceback (most recent call last): File "bio_seq_align.py", line 5, in <module> a

浏览 1提问于2013-03-08得票数 1

2回答

将GenBank平面文件转换为FASTA

python、perl、biopython、bioperl、fasta

我需要解析一个初步的GenBank平面文件。这个序列还没有发布，所以我不能通过注册来查找它并下载FASTA文件。我刚接触生物信息学，有人能告诉我在哪里可以找到BioPerl或BioPython脚本来自己做这件事吗？谢谢!

浏览 11提问于2011-06-14得票数 2

回答已采纳

1回答

将多Nexus文件转换为多个结点文件

python、bioinformatics、biopython

我有一个包含447个基因的Nexus文件，但我需要447个单独的Nexus文件(每个基因一个)有人知道怎么做吗？编辑:我尝试使用bioPython，但是每个文件只支持一种对齐方式。

浏览 30提问于2020-07-17得票数 1

2回答

如何使用biopython或其他工具逆转fastq文件？

bioinformatics、biopython

我有来自Illumina的一次读取fastq，我希望使用biopython (或其他)生成反向。我只能找到关于如何使用reverse_complement(dna)获取反向补体的信息，但我不知道如何得到相反的信息。谢谢!

浏览 0提问于2018-03-19得票数 2

回答已采纳

3回答

将Bio.Entrez类转换为字符串

python、string、biopython

我目前正在使用BioPython从PMID中查询抽象记录。然后，我将所需的信息存储在一个名为PubMed的变量中，数据类型为： class 'Bio.Entrez.Parser.StructureElement'> 例如，如果我打印它，我会收到这样的信息： {u'AbstractText': ['Hypercholesterolemia and hypertension are frequently associated with elevated sympathetic activity. Both are independent cardiov

浏览 1提问于2016-11-21得票数 0

1回答

使用biopython编写字典到文件

python、python-3.x、windows、bioinformatics、biopython

我是个新手，使用biopython。我正在试着用biopython把字典写到一个文件里。下面是我的代码： with open("file_in.fasta") as original, open("file_out.fasta", "w") as corrected: for seq_record in SeqIO.parse(original,'fasta'): desc=seq_record.description seq_dict={seq_record.id + '_1&#

浏览 14提问于2020-01-27得票数 1

回答已采纳

1回答

Biopython:不能使用.count()进行生物工程

biopython

我的目标是接收DNA序列中出现的'g‘的时间。我使用列表理解通过Biopython导入了一个DNA序列 seq = [record for record in SeqIO.parse('sequences/hiv.gbk.rtf', 'fasta')] 然后，我尝试在新创建的list comp变量上使用.count()方法。 print(seq.count('g')) 我收到一个错误，内容是 NotImplementedError: SeqRecord比较是故意不实现的。显式比较感兴趣的属性。有人知道迪里奥是什么吗？Biopy

浏览 5提问于2017-03-31得票数 0

回答已采纳

1回答

在fasta文件中更改反向序列的方向不起作用

python、python-2.7、pysam

我正在尝试在一个文件中获得正确的反向序列。代码如下： import os import sys import pysam from Bio import SeqIO, Seq, SeqRecord def main(in_file): out_file = "%s.fa" % os.path.splitext(in_file)[0] with open(out_file, "w") as out_handle: # Write records from the BAM file one at a time to the outp

浏览 3提问于2018-08-01得票数 0

1回答

防止zpl文件打印两次

printing、zpl

我有一个程序，可以生成一个包含zpl代码的文本文件。该文件应该包含我只想打印一次的唯一条形码。有没有办法保证一个唯一的条形码或防止一个文件被多次打印。

浏览 2提问于2018-11-13得票数 0

2回答

我该怎么把PYTHONPATH设置在Cygwin上？

python、cygwin、biopython

在Biopython安装说明中，它说如果Biopython不工作，我应该这样做：出口PYTHONPATH = $PYTHONPATH':/directory/where/you/put/Biopython‘ 我尝试在Cygwin中使用Biopython目录的名称(或者其中的所有内容都通过~目录)在~目录中执行，但是当我通过进入Python解释器并输入从Bio.Seq导入Seq 上面说这个模块不存在。如何使它不需要在Biopython目录中才能导入Seq？

浏览 4提问于2011-08-26得票数 4

3回答

在Biopython中提取CDS序列

sequences、biopython

大家好，我开始用Biopython编程，我想知道如何从具有所有特征坐标的基因组GenBank文件(*.gb)中提取基因序列和蛋白质标识符。我的想法是创建一个包含蛋白质标识符、基因坐标和基因序列的文本文件。如果你有任何想法，我将不胜感激。到目前为止，我已经尝试过了： for seq_record in seq_record.features: if seq_record.type == 'CDS': x=seq_record.qualifiers['protein_id'] i=seq_record.location.

浏览 0提问于2014-04-28得票数 1

2回答

打印MultipleSeqAlignment对象

bioinformatics、biopython、sequence-alignment

我有一个由clustalx生成的3个序列的比对 AAAACGT Alpha AAA-CGT Beta AAAAGGT Gamma 我可以通过align[:,:4]在Biopython中使用预定义的索引对齐进行切片但是，打印结果会产生以下结果： AAAA Alpha AAA- Beta AAAA Gamma 如何在不打印下面给出的名称的情况下捕获次级对齐？ AAAA AAA- AAAA align[:,:4].seq没有提供我想要的输出。

浏览 6提问于2012-05-08得票数 1

2回答

如何在python中解析Uniprot Dat文件来检索GO？

python、parsing、biopython、bioservices

我尝试过BioPython、SeqIO和其他解析器，但找不到任何好的工具来解析DAT文件。 https://omics.pnl.gov/software/uniprot-dat-file-parser 我试过这个，但它们不提供任何基因注释 http://biopython.org/wiki/SeqIO 他们主要讨论的是接受FASTA的输入，而不是DAT文件。 from Bio import SeqIO for record in SeqIO.parse("Fasta/f002", "fasta"): ... print("%s %i"

浏览 4提问于2017-08-01得票数 0

3回答

使用ANSI / VT100代码在PowerShell控制台中输出彩色文本

powershell、ansi、windows-console、vt100

我写了一个程序，它打印一个字符串，其中包含以使文本着色。但它在默认的Windows10控制台上并不能像你在屏幕截图中看到的那样工作。程序输出以打印字符的形式显示转义序列。如果我通过变量或管道将该字符串提供给PowerShell，则输出将按预期显示(红色文本)。我如何才能实现程序打印彩色文本而不使用任何变通方法？这是我的程序源代码(Haskell) --但是语言并不重要，只是为了让你看看转义序列是如何编写的。 main = do let red = "\ESC[31m" let reset = "\ESC[39m" putS

浏览 22提问于2018-08-04得票数 35

回答已采纳

5回答

Python编辑距离

python、sequence、edit、distance、biopython

我是一个使用Biopython来分析基因突变的分子生物学家，我的问题是：我有一个文件，其中包含许多不同的序列(数百万)，其中大多数是重复的。我需要找到重复的序列并丢弃它们，保留每个唯一序列的一个副本。我本打算使用editdist模块来计算它们之间的编辑距离，以确定哪些是重复的，但editdist只能处理2个字符串，而不能处理文件。有人知道我如何将该模块用于文件而不是字符串吗？

浏览 1提问于2012-07-13得票数 3

2回答

在fasta中添加“N”并连接数百万序列的最快方法

python、macos、biopython

我想连接fasta文件中的所有序列，在序列之间插入固定数量的“N”。我试图通过在fasta文件中的所有序列中添加一组“N”，然后使用biopython (基于食谱 )连接更改的序列。但是，我的代码在更改记录时打印出每条记录，最后打印出连接的版本，而我只希望它打印出后者。如果有人能指出我代码中的错误，或者建议一种更好的方法，我将非常感激。谢谢! 更新:我按照Celeo的建议修改了代码，但是需要很长时间才能处理我的实际文件，它有超过1200万的sequences.Is，使用其他语言(perl/awk)可以更快地做到这一点？下面是一个示例输入 $ cat test.fa >read_1 GAA

浏览 1提问于2014-09-24得票数 0

回答已采纳

1回答

在Biopython中，FASTA文件应该使用哪种字母类型？

biopython

如果我使用下面的链接中的FASTA文件，我应该在Biopython中使用哪种字母表类型？会是IUPAC.unambiguous_dna吗？ FASTA文件链接：

浏览 0提问于2013-03-18得票数 1

1回答

为什么在$‘.’内部使用$1不起作用？

bash

input() { read -p 这只是打印"$1“作为文本行。为什么它不打印“测试”，我如何使它这样做？\e[31m\e[1m $1 [Y/n] \e[0m' -n 1 -r } input "test" exit 这只是打印"$1“作为文本行。为什么它不打印“测试”，我如何使它这样做？

浏览 0提问于2020-02-29得票数 3

回答已采纳

2回答

利用蛋白质的基因标识检索DNA序列

python、bioinformatics、biopython、ncbi

我使用Biopython试图检索与蛋白质对应的DNA序列，我有一个GI(71743840)，从NCBI页面这是非常容易的，我只需要寻找参考。我的问题是在python中编写代码时，使用ncbi获取实用程序，我无法找到一种方法来检索任何可以帮助我进入DNA的字段。 handle = Entrez.efetch(db="nucleotide", id=blast_record.alignments[0].hit_id, rettype="gb", retmode="text") seq_record=SeqIO.read(handle,"gb&

浏览 2提问于2014-11-04得票数 1

回答已采纳

2回答

如何将多行fasta文件转换为不需要生物biopython的单线fasta文件

python

我有几个大的fasta文件，其中的序列被保存在多行。 >header1 AGTCGTAGCTACGTACGTACGTGTACGTACGTA TGACGTACGTAGCTGCATGCTA >header2 TGCAGATCGTAGTCGATGCTAGTGCATGCATGT ACGTAGTGCAG ... 我想把它转换成fasta文件，其中序列被组合成一行。 >header1 AGTCGTAGCTACGTACGTACGTGTACGTACGTATGACGTACGTAGCTGCATGCTA >header2 TGCAGATCGTAGTCGATGCTAGTGCATGCATGTAC

浏览 1提问于2018-06-14得票数 3

回答已采纳

1回答

如何处理biopython翻译过程中的空白

python、bioinformatics、biopython

我需要用biopython翻译对齐的DNA序列。 from Bio.Seq import Seq from Bio.Alphabet import generic_dna seq = Seq("tt-aaaatg") seq.translate() 运行此脚本将得到错误： Bio.Data.CodonTable.TranslationError: Codon 'TT-' is invalid. 有没有办法把'tt-‘翻译成X，这样整个翻译后的序列就是'XKM’了？这将在翻译比对序列时非常有用。例如，比对的序列集以pandas DataFram

浏览 70提问于2019-05-04得票数 0

回答已采纳

1回答

BioPython AlignIO ValueError说字符串必须是相同的长度？

python、bioinformatics、biopython、sequence-alignment

输入fasta格式文本文件： #!/usr/bin/python from Bio import AlignIO seq_file = open('/path/to/fa_alignment_PF00205.txt') alignment = AlignIO.read(seq_file, "fasta") 错误： ValueError: Sequences must all be the same length 输入序列不应该是相同的长度，因为在ClustalOmega上，您可以对齐不同长度的序列。这也不会work...gets相同的错误： alignm

浏览 0提问于2015-09-28得票数 2

回答已采纳

1回答

生物巨蟒氨基酸序列平均值的计算

python、sequence、biopython、dna-sequence

我有用BioPython计算fasta格式的序列长度的代码。我拿到了长号。 NP_418305.1 349 NP_418306.1 469 NP_418308.1 236 然而，现在我想计算出整个序列的平均值，就像一个相互影响的事实，我可以补充到我的研究中。能得到一些建议就太好了。 from Bio import SeqIO record_dict = SeqIO.to_dict(SeqIO.parse("aminoacids.txt", "fasta")) for key in record_dict.items(): print(key[0],"\n

浏览 2提问于2022-05-12得票数 -2

回答已采纳

1回答

如何利用entrez.efetch获得特定的蛋白质序列？

xml、sequence、bioinformatics、biopython、ncbi

我试图通过一个基因id (GI)号从NCBI中获取蛋白质序列，使用Biopython的Entrez.fetch()函数。 proteina = Entrez.efetch(db="protein", id= gi, rettype="gb", retmode="xml"). 然后，我使用以下方法读取数据： proteinaXML = Entrez.read(proteina). 我可以打印结果，但是我不知道如何单独获得蛋白序列。一旦结果显示出来，我就可以手动到达蛋白质。或者我使用以下方法检查XML树： proteinaXML[0]["G

浏览 2提问于2013-11-14得票数 2

回答已采纳

2回答

文件写入

python、json、unicode、utf-8

我正在使用twitter python库从公共流中获取一些tweet。库以json格式获取tweet并将其转换为python结构。我要做的是直接获取json字符串并将其写入文件。在twitter库中，它首先读取网络套接字并将.decode('utf8')应用于缓冲区。然后，它将信息包装在python结构中并返回它。我可以使用jsonEncoder将其编码回json字符串，并将其保存到文件中。但是我想字符编码有一个问题。当我试图打印json字符串时，它在控制台中打印得很好。但是，当我尝试将其写入文件时，会出现一些字符，如\u0627\u0644\u0644\u06be\u064f

浏览 0提问于2013-11-30得票数 2

回答已采纳

1回答

向fasta文件中的标头添加序列长度

bash、fasta

我有一个multifasta文件，并希望通过保留序列将序列长度添加到标头。 >Seq1 MADKLTRIAIVNHDKCKPKKCRQECKKSCPVVRMGKLCIEVTPQSKIAWISETLCIGCGI KILAGKQKPNLGKYDDPPDWQEILTYFRGSELQNYFTKILEDDLKAIIKPQYVDQIPKAA KGTVGSILDRKDETKTQAIVCQQLDLTHLKERNVEDLSGGELQRFACAVVCIQK >Seq2 MADKLTRIAIVNHDKCKPKKCRQECKKSCPVVRMGKLCIEVTSQSKIAWISETLCIGCGI CIKK

浏览 20提问于2019-12-31得票数 2

回答已采纳

1回答

重叠记分矩阵生物工程

python、string-comparison、overlap、biopython

我有一个包含DNA序列和序列名称的FASTA文件，我需要建立一个重叠分数的矩阵。我在Biopython中找到了模块pairwise2，它似乎做得很好。除了我的序列已经对齐，当我使用pairwise2时，它再次尝试对齐序列，这花费了很长的时间，显然每次对齐都得到相同的重叠分数。因此，我的问题是，如何获得重叠评分，而不试图再次对齐序列？以下是我到目前为止所拥有的： from Bio.Alphabet import IUPAC from Bio import SeqIO from Bio import pairwise2 fasta_file = SeqIO.parse('unambigu

浏览 4提问于2017-01-10得票数 3

回答已采纳

1回答

用Biopython保存一个模拟FASTA文件

python、string、sequence、biopython、dna-sequence

我使用Biopython删除了一些序列，因为它们太短了。但是，我不知道如何将打印的新序列保存在txt文件中。这是我的代码： from Bio import SeqIO for seq_record in SeqIO.parse("aminoacid_example.txt", "fasta"): if len(seq_record.seq)>=30: print(">",seq_record.id) print(seq_record.seq) 输出： ">NP_414584.1 "> N

浏览 9提问于2022-10-24得票数 0

回答已采纳

9回答