使用biopython从NCBI获取基因组

文章/答案/技术大牛

发布

1回答

、、、

我想用BioPython包Entrez和SeqIO下载基因组序列(NC_007779.1)。

浏览 20提问于2019-03-14得票数 0

2回答

使用Biojava或Biopython检索某些生物的全基因组genbank文件

、、、

谁知道如何使用BIopython或BioJAVA从FTP ncbi中自动搜索和解析gbk文件。我在BIojava中搜索了实用程序，但没有找到任何实用程序。我也尝试过BioPython，下面是我的代码：Entrez.email = "test@yahoo.com"print record["Count"] id_L = reco

浏览 22提问于2014-03-14得票数 1

3回答

如何在biopython entrez.esearch中下载完整的基因组序列

、、

我只需要从NCBI (GenBank(full)格式)下载完整的基因组序列。我对“全基因组”而不是“全基因组”感兴趣。gatunek, property='complete genome' )#title='complete genome[title]')结果我只得到了基因组的小片段我知道如何通过NCBI网站手动操作，但这非常耗时，我在那里使用的查询： escherich

浏览 4提问于2013-08-27得票数 3

1回答

是否有一种使用Python从NCBI下载fasta格式的基因组的简单方法？

、、、、

我正在尝试使用Python从NCBI (最好是fasta格式)下载基因组，但是到目前为止没有什么真正的工作。API对我来说是新的，我并不真正理解文档()。我的最终目标是下载一个属内每个物种的所有基因组，但是用Python下载一个基因组将是一个很好的开始。编辑:这是我的代码示例 taxon_name = &

浏览 8提问于2022-04-26得票数 0

1回答

我编写了一个脚本，它使用GenBank文件和Biopython从GBK文件的序列部分获取给定基因的序列，我的同事在他们的工作中使用该序列。我们现在在一个新的数据集上遇到了一些问题，结果是下载的GBK文件没有包含序列(从NCBI的GenBank网站下载时很容易发生这种情况)。Biopython没有抛出错误，而是在使用record.seq[start:end]时返回很长的Ns序列。从一开始就抓住这个问题的最简单的方法是用错误消息停止脚本吗

浏览 4提问于2014-08-28得票数 0

回答已采纳

1回答

如何将qblast XML输出转换为NCBI BLAST -outfmt 17？

、、

我从NCBI standalone BLAST开始我的项目，并使用-outfmt 17选项。对我来说，格式化是非常有用的。但是，我不得不更改为Biopython，现在我正在使用qblast将我的序列与NCBI NT数据库进行比对。我是否可以保存/转换qblast XML，其格式可与NCBI BLAST独立-outfmt 17格式相媲美？干杯，菲利普

浏览 6提问于2016-08-11得票数 0

3回答

通过Biopython从NCBI查询ncbi序列

、、、

如何查询给定染色体Genbank标识符的NCBI序列，并使用Biopython启动和停止位置？ CP001665 NAPP TILE 6373 6422 .

浏览 1提问于2014-06-27得票数 0

回答已采纳

2回答

利用蛋白质的基因标识检索DNA序列

、、、

我使用Biopython试图检索与蛋白质对应的DNA序列，我有一个GI(71743840)，从NCBI页面这是非常容易的，我只需要寻找参考。我的问题是在python中编写代码时，使用ncbi获取实用程序，我无法找到一种方法来检索任何可以帮助我进入DNA的字段。

浏览 2提问于2014-11-04得票数 1

回答已采纳

1回答

并行BLAST程序耗时太长

、、、、

有没有办法使用在线服务器进行搜索？如果有办法，我可以只针对病毒基因组进行搜索吗？

浏览 35提问于2021-03-10得票数 0

1回答

当用C++冻结PyInstaller脚本时，包括PyInstaller可执行文件

、、、、

我试着阅读PyInstaller文档和使用规范文件，以及Google/SO，但是没有找到任何明确的答案。我使用Biopython编写了一个python脚本，并使用PyInstaller将它变成了一个可执行文件，并且运行良好。但是，脚本使用了一个Biopython函数(NcbiBlastnCommandline())，它是NCBI Blast+ blastn程序(用C++编写)的包装器，目前用户仍然需要在本地安装NCBI Blast

浏览 3提问于2018-07-27得票数 1

回答已采纳

1回答

如何根据ID从包含多个基因组序列的Genbank文件中删除无效序列

、、

我有一个大约3 GB的Genbank文件，其中包含大约20,000个细菌基因组序列的完整Genbank注释。我的目标是使用BioPython解析这些序列，并为非重复序列编写单独的fasta文件，如下所示： from Bio import SeqIO records = SeqIO.parse(r'C:\UsersSeqIO.write(record, handle, 'fasta') 这对于前2,000个序列非常有效，但随后到达具有无效页脚的条目，并生成错误消息ValueError:序列行格式错误‘标题>

浏览 41提问于2019-06-26得票数 0

1回答

如何识别BioPython中的基因编码框

、、

我正在使用BioPython遍历GenBank文件中的开放阅读框。更具体地说，我考虑了在GenBank中标注为“CDS”的特性。gbk_dat.features: # Identify coding frame 我想知道是否有可能确定一个基因相对于整个基因组在哪个编码框架中如果一个基因从基因组的位置1开始，它就会在编码框架1中，如果它在2开始，在编码框架2中，如果在5，那么框架2也是如此。(我知道我可以相对容

浏览 0提问于2016-03-04得票数 0

1回答

用于迭代trhough变量URL的循环(Python)

、、、

其主要思想是从NCBI数据库中获得特定基因组和起始点的不同序列。到目前为止，我能够对一个基因组和一个特定的位置进行简单的搜索： start="359055" link = "https://eutils.ncbi.nlm.nih.gov/entrez/eutils/e

浏览 0提问于2019-03-07得票数 2

2回答

从hg18到GRCh38参考人类基因组

有没有人知道是否有可能将SNP坐标从Hapmap数据库转换为新的参考基因组GRCh38。UCSC还没准备好升力器。有什么建议吗？

浏览 1提问于2014-02-20得票数 0

回答已采纳

1回答

替代Bio.Entrez EFetch从NCBI下载全基因组序列

、、

我的目标是从NCBI下载完整的后生动物基因组序列。我有一张我需要的基因组序列的唯一ID号的列表。我计划使用Bio.Entrez模块EFetch下载数据，但今天通过2011年11月2日的发布说明()了解到，EFetch不支持“Genome”数据库。

浏览 3提问于2016-05-25得票数 1

1回答

固定数量的结果生物工程

、、

我正在尝试使用以下代码检索搜索结果，以便通过biopython从发布的查询中检索from Bio import Medline Entrez.email

浏览 1提问于2016-05-09得票数 1

回答已采纳

1回答

试图从FTP中流文件

、

我正在尝试访问FTP (NCBI基因组库)并循环遍历这些文件并读取它们。 ftp.passive = true我找到了，但它是用Python

浏览 3提问于2014-09-22得票数 1

回答已采纳

1回答

使用漂亮的汤导航到下一页

、、

如何使用漂亮的汤浏览所有页面的结果。例如，我必须刮这个网站： “((肿瘤学)和乳腺癌)并导致”我怎么把所有的页都取下来？我试着查看请求头中的表单数据。试着修改一些字段。实际上，我需要遍历页面来获取所有内容。任何帮助都将不胜感激。post_args = urllib.urlencode(post_params) baseurl = 'http://www.ncb

浏览 1提问于2015-02-14得票数 1

回答已采纳

1回答

你能从FTP获取多个文件吗？

、、

我正试图从NCBI检索数百个基因组，并通过管道将它们传输到服务器Phaster (直接或通过我的本地服务器)。你能通过管道输出FTP在一个命令中检索多个文件吗？我尝试过使用rsync和wget。

浏览 6提问于2020-07-21得票数 0

1回答

基于标签下载所有NCBI* PubMed ID*

、

我能够读入一篇论文的PubMed ID，并使用以下代码返回一组关于该论文的记录： from Bio import EntrezEntrez.email如果你在NCBI网站上看到同样的论文： ? 我找到了所有here代码的列表，但我不清楚如何使用这些代码。

浏览 19提问于2020-12-16得票数 0

回答已采纳

点击加载更多