Magic-BLAST简单介绍

之前看论文从全基因组重测序数据中提取叶绿体的reads会使用blast,自己一直在想如何具体实施,原来blast有一款工具专门在做这个事情的 —— Magic-Blast Magic-Blast is a tool for mapping large next-generation RNA or DNA sequencing runs against a whole genome or transcriptome. The reference genome or teanscriptome can be given as a Blast database or a Fasta file. it is preferable to use Blast database for large genomes, such as human, or transcript collections. The full list of options is listed when you use -help option. 论文题目、发表期刊及发表时间 Magic-BLAST, an accurate DNA and RNA-seq aligned for long and short reads 好像还没有发表,自己是在bioRxiv上找到的论文 first posted online Aug. 13, 2018 doi: http://dx.doi.org/10.1101/390013

参考资料
  • https://ncbiinsights.ncbi.nlm.nih.gov/2018/08/22/magic-blast-accurate-dna-rna-seq-aligner/ 介绍
  • https://ncbi.github.io/magicblast/ 帮助文档
下载地址
  • ftp://ftp.ncbi.nlm.nih.gov/blast/executables/magicblast/LATEST 直接解压出来就是两个可执行程序
基本的使用方法
  • 1、构建数据库
makeblastdb -in Malus_baccata.fasta -dbtype nucl -parse_seqids -out Malus_baccata

-in 参考序列 -dbtype 数据类型:核苷酸和蛋白质可选 -parse_seqids 暂时还没搞懂这个参数的意思 -out 数据库的名称

  • 2、比对
# 默认输入文件为fasta格式
# 单个fasta文件
magicblast -query reads.fasta -db Malus_baccata
# 两个fasta文件
magicblast -query reads.fasta -query_mate mates.fasta -db Malus_baccata
# 如果输入文件为fastq格式
magicblast -query reads.fastq -db Malus_baccata -infmt fastq
# 双端数据
magicblast -query reads_R1.fastq -query_mate reads_R2.fastq -db Malus_baccata -infmt fastq
  • 3、Splicing可变剪切 By default, Magic-BLAST aligns RNA reads to a genome and reports spliced alignmets.
  • 4、多线程-num_threads参数
magicblast -query reads.fasta -db genome -num_threads 10

本文分享自微信公众号 - 小明的数据分析笔记本(gh_0c8895f349d3),作者:Punicagranatum

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-04-08

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 动植物基因组大小粗略比较

    在知乎看到问题 为什么植物基因组比动物基因组大(为什么植物基因组似乎比脊椎动物拥有更多的基因?)? 印象里好像也不一定,因为拟南芥的基因组也才100多M,自己之...

    用户7010445
  • R语言可视化展示gff3格式基因组注释文件简单小例子

    https://girke.bioinformatics.ucr.edu/GEN242/mydoc_Rgraphics_7.html

    用户7010445
  • 南京林业大学正版win10系统安装

    用户7010445
  • 统计符合某一条件的最大最小平均值

    If、Min、Max、Count、Sum、Average、Countif、Sumif,以上八个统计函数都熟知用法没有。重口难调,如果以上的用法不是很熟悉的话,可...

    用户1332619
  • 自定义枚举 --- Swagger文档展示

    十毛
  • linear regression and logistic regression

    通过工资和年龄预测额度,这样就可以做拟合来预测了。有两个特征,那么就要求有两个参数了,设置

    西红柿炒鸡蛋
  • [PHP] PHP闭包(closures)

    陶士涵
  • Maven中日志jar包冲突报错:Class path contains multiple SLF4J bindings

    可以转到pom.xml,打开Dependency Hierarchy并找到slf4j条目。除了通过右键单击“exclude maven artifact”排除其...

    黑泽君
  • Google内核浏览器 快速 轻巧 方便

    没错,你看到的 QQ 浏览器,360 浏览器等等等等都是基于 Google 浏览器开源框架构造。优势需要说嘛?碾压 IE 内核 所以骚年,不动手打造一个属于你自...

    cxt084
  • 多层感知机(MLP)与神经网络结构 | 深度学习笔记

    为了尽量能形成系统的体系,作为最基本的入门的知识,请参考一下之前的一篇:感知机 | 神经网络 。 上篇文章让你形成对于神经网络最感性的理解。有些看不懂的直接忽...

    用户1332428

扫码关注云+社区

领取腾讯云代金券