使用biopython仅下载部分genbank文件

文章/答案/技术大牛

发布

1回答

、、、

我刚接触Biopython，在解析genbank文件时遇到了性能问题。rec = SeqIO.read(gb_acc1, 'genbankEntrez.efetch(db='nucleotide

浏览 8提问于2016-07-27得票数 1

1回答

没有基因组序列的GBK文件的Biopython解析

、、

我编写了一个脚本，它使用GenBank文件和Biopython从GBK文件的序列部分获取给定基因的序列，我的同事在他们的工作中使用该序列。我们现在在一个新的数据集上遇到了一些问题，结果是下载的GBK文件没有包含序列(从NCBI的GenBank网站下载时很容易发生这种情况)。Biopython没有抛出错误，而是在使用record.seq[start:end]时返回很

浏览 4提问于2014-08-28得票数 0

回答已采纳

2回答

在Biopython中捕获Genbank文件解析错误

、

我已经使用genbank Entrez模块下载了一个与类似的BioPython文件列表。在随后解析这些文件时，我遇到了一个错误，因为我从Entrez下载的genbank文件是给予基因组不完整的有机体的临时RefSeq的一部分()。当我尝试读取这个文件时，我得到一个记录错误，并且我的脚本停止。我正在尝试编写一个函数来避免这些记录。SeqIO/__init__.py", line 6

浏览 0提问于2012-12-08得票数 1

回答已采纳

3回答

我不知道如何为要在python中打开的文件指定路径

、

我是Python的新用户，我尝试导入genbank和fasta格式的文件。在他们的文档中，他们提供了一个示例，说明如何将数据集导入到Python中。具体地说，他们在Biopython教程和Cookbook的第16页中提供了以下示例：现在，他们在第14页提到，Biopython源代码包含这个文件，这是真的。然而，python如何通过Bio import SeqIO知

浏览 0提问于2012-02-13得票数 1

2回答

将FASTA转换为GenBank

、、

有没有一种方法可以使用BioPython将FASTA文件转换成Genbank格式？关于如何从Genbank转换到FASTA，有很多答案，但不是相反的。

浏览 4提问于2015-05-12得票数 6

2回答

将GenBank平面文件转换为FASTA

、、、、

我需要解析一个初步的GenBank平面文件。这个序列还没有发布，所以我不能通过注册来查找它并下载FASTA文件。我刚接触生物信息学，有人能告诉我在哪里可以找到BioPerl或BioPython脚本来自己做这件事吗？谢谢!

浏览 11提问于2011-06-14得票数 2

回答已采纳

1回答

我正在使用BioPython遍历GenBank文件中的开放阅读框。更具体地说，我考虑了在GenBank中标注为“CDS”的特性。所以我的代码是这样的：gbk_dat = SeqIO.read(genbank_filepath, 'genbank') for feature in gbk_dat.features(我知道我可以相对容易地编写脚本，但我喜欢依赖BioPython，因为它在以

浏览 0提问于2016-03-04得票数 0

1回答

这是有效的Genbank功能描述还是Biopython错误？

、

我偶然发现了一个Genbank格式的文件(这里显示为一个最小的虚拟示例)，其中包含一个嵌套特性，如下所示： xxxx_domaincomplement(complement(1..145)) 这样的功能会使当前的Biopython Genbank解析器(1.59版本)崩溃，但在以前的版本(例如1.55)中显然不会。也就是说，这是Biopython中的小故障还是Genbank文件<

浏览 2提问于2012-04-18得票数 2

1回答

如何根据ID从包含多个基因组序列的Genbank文件中删除无效序列

、、

我有一个大约3 GB的Genbank文件，其中包含大约20,000个细菌基因组序列的完整Genbank注释。我的目标是使用BioPython解析这些序列，并为非重复序列编写单独的fasta文件，如下所示： from Bio import SeqIOfor record in records: if

浏览 41提问于2019-06-26得票数 0

1回答

Biopython(SeqIO) 'FileNotFoundError‘

、、、、

我是BioPython的新手，正在尝试使用几个模块。但是，如您所见，在使用Genbank或FASTA等文件的过程中，下一个模块中会出现这样的错误。我可以问如何解决这个问题吗?我应该经过什么程序呢？Genbank文件也保存在计算机中，但无法识别该文件。

浏览 4提问于2022-02-11得票数 0

1回答

迭代一系列GenBank基因，并将每个基因的特征添加到列表中，只返回最后一个基因

、、、、

我正在尝试使用BioPython遍历genbank文件的基因列表。它看起来是这样的： class genBank: gbStart = int() gbStrand = int() for seq_feat

浏览 14提问于2019-03-13得票数 1

回答已采纳

1回答

如何创建genbank平面文件

、、

我很难使用Biopython SeqIO (变成类似于的东西)创建一个genbank平面文件，我能够通过以下操作创建一个genbank simple_seq = Seq(row[15],IUPAC.unambiguous_dna

浏览 5提问于2013-11-12得票数 0

回答已采纳

1回答

如何切取特定数目的fasta序列并生成ORFs

、

我有如下所示的文件： CDS 36..183 CDS571..841 CDS 843..863>gi1234 HIVg

浏览 0提问于2016-06-23得票数 0

1回答

内存中第三方对象的大小

、

由于此函数可能会为第三方返回不准确的结果，如何确定BioPython对象使用了多少内存？我使用代码加载了一个286MB的文件(修改后)：handle = open("example.gb", "rU")handle.close() 而sys.getsizeof(records)表示它正在使用</em

浏览 1提问于2014-01-16得票数 1

1回答

Python字符串级联和bash参数展开的等效

、、、

我对python有点陌生，但我发现自己在bash中做的很多事情是在文件名前加上字符串和参数展开。.*}/ ; done 这将是一个示例，用于删除文件加载的扩展名，根据这些名称创建目录，然后将文件移动到它们的名称文件夹中。如果我想实现类似的事情，比如根据输入文件名重命名函数的输出(下面是Biopython函数的一个例子)，我已经看到了几种使用字符串连接等方法来实现它，但是没有括号等等，它看起来很混乱，并且可能会在整个地方创建带有空格SeqIO.convert(<

浏览 2提问于2016-08-15得票数 0

回答已采纳

1回答

Biopython: SeqIO.parse() FileNotFoundError

、

我是生物信息学和Biopython的新手，所以我对它有一些困难。我正在阅读Biopython (SeqIO)文档，但是当我尝试执行一些SeqIO.parse()命令时，我得到了FileNotFoundError。例如，我想要得到"example.fasta“文件(我没有它在我的电脑上)。SeqIO.parse("example.fasta", "fasta"):但是，我得到的只有FileNotFoundError: Errno 2没有这样的

浏览 1提问于2018-02-12得票数 0

回答已采纳

3回答

使用python/biopython对整个genbank文件进行不完全解析

、、

我的脚本的主要目标是将genbank文件转换为gtf文件。我的脚本应该打开/解析一个genbank文件，从每个CDS条目中提取信息，并将信息写入另一个文件。脚本不会产生错误，但在终止之前只会从genbank文件的前1/2写入信息。这是我的密码。我已经多次重新下载该文件，以确定是否存在下载问题，并且我已经直观地检查了该文件(我发现它没有错误)。我还在另一个同样大的

浏览 7提问于2015-12-17得票数 2

回答已采纳

1回答

使用biopython* SeqIO从命令行处理问题文件*

、、

这是我第一次尝试使用命令行参数，而不是又快又脏的sys.argv[]，并编写一个更“合适”的python脚本。出于某些我现在不知道的原因，它似乎反对我试图从命令行使用输入文件的方式。脚本的目的是获取一个输入文件，一些数字索引，然后切出文件的一个子集区域，但是我总是得到错误，我给我传递的文件的变量没有定义： joehealey@7c-d1-c3-89-86-2c:~/Documents# Based upon the tutorial at http://<e

浏览 0提问于2016-08-05得票数 0

回答已采纳

3回答

在Biopython中提取CDS序列

、

大家好，如果你有任何想法，我将不胜感激。

浏览 0提问于2014-04-28得票数 1

1回答

请帮助我从磁盘读取genbank文件并将其转换为fasta

、、、

请指导我使用biosmalltalk (Pharo版)将GenBank序列转换为其等效的FASTA格式。我已经想好了从磁盘读取一个文件：| GenBank x y m| x:=Time millisecondClockValue。m:=BioParser tokenizeMultiFasta:文件内容。y:=Time millisecondClockValue.成绩单打开。文字记录通过。文字记录显示:m；cr。

浏览 4提问于2014-09-26得票数 0

点击加载更多