专栏首页liu_ll的生信学习笔记WGS实战笔记(三)----质量和碱基数bug及samtools 排错

WGS实战笔记(三)----质量和碱基数bug及samtools 排错

先提上昨天跑的程序的报错信息:这个是跑了一半之后,报错然后退出了

picard的报错信息

根据报错信息的提示:说是我的碱基信息和质量信息不相符,我看了一下碱基信息150bp,质量信息140个。但是这是SAM文件里的信息,所以还是得回溯到fq文件中看看原始的情况

zcat ./BCA0106_R2.fq.gz | grep "E00492:317:HLG2MCCXY:3:1201:26869:33973" -C 4 >shuchuR2.txt

可以利用zcat这个linux命令查看gz文件的内容,然后带上grep函数,-c是可以看前后4行,输出到输出的一个txt文件夹中。

我分别在质控前和质控后的文件都用zcat命令看了,进行比较。 1:用zcat跑完的结果

质控前R2 的reads的信息

质控前R1 的reads信息

这个都说明公司测序的数据没有问题 问题解决方案:我还是回溯到最原始的方法,先samtools 然后输出到bam文件,再对bam文件进行排序(其实有优化代码)

bwa mem -t 8 -M -Y -R "@RG\tID:L1\tSM:BCA0106-2\tLB:WGS\tPL:Illumina" /asnas/sunyl_group/liull/Database/hg38/chroms-index/hg38.fa  /asnas/sunyl_group/liull/twins_WGS/BCA0106/1_qc/output_BCA0106_Rnas2_paired.fq.gz  /asnas/sunyl_group/liull/twins_WGS/BCA0106/1_qc/output_BCA0106_R1_paired.fq.gz | samtools view -Sb - > ./BCA0106.bam
samtools sort -@ 8 -m 10G -O bam -o /asnas/sunyl_group/liull/twins_WGS/BCA0106/2_BWA/BCA0106.paired.sort.bam  /asnas/sunyl_group/liull/twins_WGS/BCA0106/2_BWA/BCA0106.bam   

先是用samtools先把bam文件生成,利用了管道符,避免了中间的sam文件的生成 。前面这个命令跑的时间很久,大概16个小时。 如果内存足够大的话,推荐下面的优化代码

bwa mem -t 8 -M -Y -R "@RG\tID:L1\tSM:BCA0106-2\tLB:WGS\tPL:Illumina" /asnas/sunyl_group/liull/Database/hg38/chroms-index/hg38.fa  /asnas/sunyl_group/liull/twins_WGS/BCA0106/1_qc/output_BCA0106_Rnas2_paired.fq.gz  /asnas/sunyl_group/liull/twins_WGS/BCA0106/1_qc/output_BCA0106_R1_paired.fq.gz | samtools sort  -@ 8 -m 10G -O bam 
 - > /asnas/sunyl_group/liull/twins_WGS/BCA0106/2_BWA/BCA0106.paired.sort.bam  

无奈要求内存和线程,带不起来会报错。百度了一遍不是很懂文件的信息,求大神翻牌求教

.e文件信息

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • “黄金鼠饼了解一下?” --------有意思的DNA甲基化现象

      在生命科学的发展中,模式动物有着巨大的贡献,说起萌萌哒的模式动物,你的第一反应是什么?是传说中的实验小白鼠吗?

    liu_ll
  • WGS实战笔记(二)

    -----------------------------------------分割线------------------------------------...

    liu_ll
  • BBQ(生信基础问题17)----mapping专题:SAM和BAM了解一下?

    ----------------------------------------------我是给出代码的分割线------------------------...

    liu_ll
  • Hexo搭建个人博客(三)—— Hexo博客的美化

    通过前两节的学习,我们已经搭建好自己的博客,就像盖房子一样要对内部进行装修,也就是对博客进行美化。 ---- 安装Hexo博客主题 Hexo博客可以安装不同的...

    木制robot
  • 设计模式 | 策略模式及典型应用

    在软件开发中,我们也常常会遇到类似的情况,实现某一个功能有多条途径,每一条途径对应一种算法,此时我们可以使用一种设计模式来实现灵活地选择解决途径,也能够方便地增...

    小旋锋
  • 逻辑回归or线性回归,傻傻分不清楚

    线性回归作为一种常用的关联分析工具,其功能强大,解释度高,但是其缺点也是很明显的。其只适用于处理连续型的变量,无法处理离散型的变量,比如对于case/contr...

    生信修炼手册
  • Macheine Learning Yearning学习笔记(一)

    Chapter 1、Why Machine Learning Strategy (为什么要学习机器学习策略)

    yuquanle
  • CentOS7安装Apache

    Apache是一个开源的Web服务器,可以在同一台物理主机上配置单个或多个web站点。

    前端黑板报
  • 浅谈高并发解决方案

    摘要: 高并发一直是然个人头疼的问题;然而,其解决方式则是一套组合策略,由整体入手,逐步分析,逐步解决部分问题,进而解决所有问题;就像一支庞大的输水管道,不断的...

    Java高级架构
  • Weex学习笔记

    我是按照http://alibaba.github.io/weex/doc/demo/modal.html 这个网址的内容进行weex学习的,这只是笔记。

    刘晓杰

扫码关注云+社区

领取腾讯云代金券