我正在使用下面的代码来执行搜索,但是我从IdList获得的I与在线搜索中的I不匹配。
from Bio import Entrez
Entrez.email = "myEmail@gmail.com"
handle = Entrez.esearch(db = "nucleotide", term = "chordata[orgn] AND
chromosome", retmax = 10, idtype = "acc")
genome_ids = Entrez.read(handle)['IdList']
print(genome_ids)
当我打印id的时候,他们和online.Does不匹配,有人知道为什么吗?这些是我打印genome_ids时得到的id:
['NG_017163.2', 'NM_017553.3', 'NG_059281.1', 'NM_005101.4',
'MH423692.1', 'MH423691.1', 'MH423690.1', 'MH423689.1', 'MH423688.1',
'MH423687.1']
以下是在线搜索的链接:https://www.ncbi.nlm.nih.gov/nuccore/?term=chordata%5Borgn%5D+AND+chromosome
还有谁知道我如何从chordata系统下载所有生物体的染色体和线粒体基因组,我想通过电子设备使用BioPython。
发布于 2018-06-07 15:45:14
我如何从chordata门下载所有生物体的染色体和线粒体基因组
chordata
,在下拉列表中选择complete name
30
),并在下拉列表中选择filter has genome sequence
nucleotide
复选框现在,您将查看chordata的完整分类树及其子分类。每个分类单元背后的数字是该分类单元的序列数。因此,NCBI包含84,366,537个不同的chordata序列。
您可能没有足够的空间下载它们,所以选择一个选项,点击出租车后面的数字,然后选择Send to
> File
> FASTA
。
https://stackoverflow.com/questions/50671876
复制相似问题