从零到壹:10元 Mapping神器STAR的安装及用

STAR

天下武功唯快不破,STAR就是这样一个神器,人家mapping几个小时,STAR只要15分钟~~~~

干货的流程

如果你按照下面的教程已经获得了一台云服务器,那么按照如下操作进行。cd ~/bin

https://github.com/alexdobin/STAR/archive/2.5.3a.tar.gztar -xzf 2.5.3a.tar.gzcd STAR-2.5.3aln -s ~/bin/STAR-2.5.3a/bin/Linux_x86_64/STAR ~/bin/STAR按照上面的方法,就可以在云服务器中使用STAR了此时你需要建立好indexindex是干嘛的?记住这个是你mapping前很重要的东西一定要建立好,不然后面都白弄。其他的自行百度google。index建立前你需要下载两个文件:GTF基因组fa文件GTF下载地址在

ftp://ftp.sanger.ac.uk/pub/gencode/Gencode_human/release_27/gencode.v27.chr_patch_hapl_scaff.annotation.gtf.gz

基因组fa文件用下面网站方法获得hg38.fahttps://github.com/simonvh/genomepy先下载到自己电脑上,再用FileZilla上传到服务器或者用服务器下载,在传到自己电脑上。以后留着R语言注释用这个时候把云服务器的配置调高,内存32G以上就行。

cd到你想要保存的位置,建立index,下面是命令

nohup STAR --runMode genomeGenerate --runThreadN 24 --genomeDir hg38_star_v27c_index --genomeFastaFiles hg38.fa --sjdbGTFfile hg38_v27.gtf &

runThreadN 后面的数字填云服务器cpu核数x2genomeDir 自己命名nohup····&命令挂起用的上面那个命令,是所有文件都在一个文件中的命令如果不在一个文件,在文件前面加上相应前缀。准备好你的fastq文件,虽然STAR有直接解压gz文件的选项,但是不建议,最好解压好你的fastq以后在运行,这样意外会少一些。以双端测序为例,你应该有两个文件A_1.fq A_2.fq,然后Mapping

下面是命令

nohup STAR --genomeDir hg38_star_v27c_index --runThreadN 24 --readFilesIn /root/files/A_1.fq /root/files/A_2.clean.fq --outFileNamePrefix ~/files//Results/A --outSAMtype BAM Unsorted SortedByCoordinate --quantMode GeneCounts &

然后,静静等待~~~大概15~20分钟以后得到的用文本编辑器打开看看,这就是原始文件。用自己电脑上的R进行后续分析就好了这个时候一定要注意云服务器配置调最低档,这样省钱如果不需要了,你可以制备好镜像,销毁现有的,下次在恢复。未完待续

谢谢支持

下面这个是自学群

记住关注哦

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180222G0KV6Y00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券