首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

从NT_NR数据库中提取子库

NCBI的csvtk软件,http://bioinf.shenwei.me/csvtk/download/,linux系统也是直接解压,即可使用 4 (选择性步骤)NCBI taxonomy数据库下还有accession2taxid...库,这个库里面也有蛋白以及核酸的accession以及对应的分类id,但是经过尝试,采取这种方法提取的子库序列往往出乎意料的少,很可能是该库的accession与NT/NR库的accession不一致,...前者可能冗余更多,因此该方法可忽略,见仁见智吧,下面给个例子,例如: #从taxonomy数据库中的nucl_wgs.accession2taxid提取accession号 pigz -dc prot.accession2taxid.gz...\ | csvtk grep -t -f taxid -P $id.taxid.txt \ | csvtk cut -t -f accession.version,taxid \ | sed 1d \...|" ~/.taxonkit/names.dmp 33208 taxonkit list --ids 33208 --indent "" > $id.taxid.txt 6 从下载好的NT库提取对应的accession

49840
您找到你想要的搜索结果了吗?
是的
没有找到

从NT_NR数据库中提取子库

NCBI的csvtk软件,http://bioinf.shenwei.me/csvtk/download/,linux系统也是直接解压,即可使用 4 (选择性步骤)NCBI taxonomy数据库下还有accession2taxid...库,这个库里面也有蛋白以及核酸的accession以及对应的分类id,但是经过尝试,采取这种方法提取的子库序列往往出乎意料的少,很可能是该库的accession与NT/NR库的accession不一致,...前者可能冗余更多,因此该方法可忽略,见仁见智吧,下面给个例子,例如: #从taxonomy数据库中的nucl_wgs.accession2taxid提取accession号 pigz -dc prot.accession2taxid.gz...\ | csvtk grep -t -f taxid -P $id.taxid.txt \ | csvtk cut -t -f accession.version,taxid \ | sed 1d \...|" ~/.taxonkit/names.dmp 33208 taxonkit list --ids 33208 --indent "" > $id.taxid.txt 6 从下载好的NT库提取对应的accession

1.2K31

超精华生信ID总结,想踏入生信大门的你-值得拥有

GenBank-Accession Number:Accession Number又叫做注册号/登录号,像GI号一样,它也是唯一的序列标识符。但是与GI号不同的是,AC号一旦分配就不会改变了。...这里呢,还需要注意两个概念,那就是GI号和Accession Number.Version.我们的GI号和Accession Number.Version都是可以用来追踪一条序列的演化的。...Accession number主体编号不会改变,但是它所对应的版本(Accession number.Version)会随着增加。...accession number不会随数据的更新而变化,只有数据被删除的时候,accession number才会被删除。所以它是非常稳定的标识符,相当于数据库中的主键。...Entry name与Accession Number的关系和区别 提交数据到UniprotKB之后,每个数据都会被分配一个Accession Number(AC号),这个AC号是唯一的。

6K104
领券