建立本地的Blast数据库

Blast(basic local alignment search tool) 局部序列比对基本检索工具,是NCBI开发的一款基于序列相似性的数据库搜索程序。主要的BLAST程序有以下几种:

BLAST的在线版https://blast.ncbi.nlm.nih.gov/Blast.cgi可以方便的进行单一的同源性序列搜索,但是不方便进行大批量的数据操作,也不能建立自己的数据库。接下来小编就要教大家如何建立本地的BLAST数据库。

基于BLAST优秀的算法,BLAST程序可以轻松的在普通的个人电脑中运行。

BLAST程序的官方下载地址:ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST

在网页中我们可以看到很多文件,其中*.md5是效验文件,我们可以忽略它,现在一般是x64的操作系统,我们可以根据自己的电脑系统,下载x64的win或Linux或macosx版本。

小编下载的是windows的一个压缩包版本,解压后得到这样一个文件夹:

进去后可以看到目录结构并不复杂,readme文件对BLAST作了一个简要的介绍:

bin文件夹通常是主程序的文件夹,我们进去后看到很多*.exe的可执行程序,但是双击后并不能运行。

这种情况一般是需要用命令提示符来运行。

通过win+R 输入cmd命令,再通过cd 命令进入当前的bin 文件夹,或者直接在bin文件夹内按住shift和鼠标右键,选择在此文件夹打开命令提示符

我们通过makeblastad -help命令,查看创建本地数据库的帮助文件

可以发现需要输入文件,在NCBI数据库,我们可以方便地下载我们需要的序列文件,下载后复制到bin文件夹内,方便操作。

小编在这里下载了一个红曲基因组的fasta文件

并复制到bin文件夹下

之后执行命令 makeblastdb in sequence.fasta -dbtype mucl -out sesameESTdb

这里取名为sesameESTdb是受某教程误导,大家可以按习惯起名字。

-in 后面是空格加输入数据库文件的名称,-dbtype后面是空格加数据库类型(核苷酸是nucl,蛋白质是prot),-out后面是空格加输出数据库名称

接下来就可以拿目标序列来比对了,由于手头上没有相似的序列,小编直接从sequence.fasta中复制了一段,另存为test.fasta进行比对。

输入 blastn -query test.fasta -db sesameESTdb -out 001.txt

可以看到在bin文件夹下出现了一个001.txt文件,打开后可以查看结果:

至于结果的含义大家可以参考BLSAT官方文档

ref:

Zheng Zhang, Scott Schwartz, Lukas Wagner, and Webb Miller (2000), "A greedy algorithm for aligning DNA sequences", J Comput Biol 2000; 7(1-2):203-14.

本文来自企鹅号 - 手机与电脑媒体

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏逸鹏说道

小解Redis 系列

官网:http://redis.io/ 推荐一个开源组件:StackExchange.Redis https://github.com/StackExchang...

31590
来自专栏开发与安全

linux网络编程之POSIX 消息队列 和 系列函数

一、在前面介绍了system v 消息队列的相关知识,现在来稍微看看posix 消息队列。 posix消息队列的一个可能实现如下图: ? 其实消息队列就是一个可...

29600
来自专栏我的技术专栏

《Go in action》读后记录:Go的并发与并行

10130
来自专栏Python

flask celery 使用方法

由于celery4.0不支持window,如果在window上安装celery4.0将会出现下面的错误

52200
来自专栏Golang语言社区

《GO IN ACTION》读后记录:GO的并发与并行

一、使用goroutine来运行程序 1. Go的并发与并行 Go的并发能力,是指让某个函数独立于其他函数运行的能力。当为一个函数创建goroutine时,该函...

46770
来自专栏安富莱嵌入式技术分享

【RL-TCPnet网络教程】第36章 RL-TCPnet之FTP服务器

本章节为大家讲解RL-TCPnet的FTP服务器应用,学习本章节前,务必要优先学习第35章的FTP基础知识。有了这些基础知识之后,再搞本章节会有事半功倍的效果。

9400
来自专栏owent

可执行文件压缩

最近看Rust相关东西的时候看到一篇关于压缩可执行文件的文章。压缩可执行文件对嵌入式开发特别有用,但是延伸一下用来减少我们游戏行业里预编译的工具二进制包大小和A...

52010
来自专栏bboysoul

cheat一个实用 Linux 命令示例集合

在使用linux的时候我们会经常碰到这样的问题,比如使用nmap,我后面到底加什么参数呢?碰到这种情况我们只能使用man或者它的帮助命令来查看使用方法,但是有的...

8220
来自专栏Kevin-ZhangCG

[ Java面试题 ]JavaWeb篇

39580
来自专栏大内老A

提供第三种代码生成方式——通过自定义BuildProvider为ASP.NET提供代码生成

之前写了一些关于代码生成的文章,提供了两种不同方式的代码生成解决方案,即CodeDOM+Custom Tool和T4。对于ASP.NET应用,你还有第三种选择—...

236100

扫码关注云+社区

领取腾讯云代金券