前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >跟着Nature学数据分析:minimap2+DeepVariant流程利用hifi数据检测snp和indel

跟着Nature学数据分析:minimap2+DeepVariant流程利用hifi数据检测snp和indel

作者头像
用户7010445
发布2024-05-18 08:47:52
1350
发布2024-05-18 08:47:52
举报

论文

Graph pangenome captures missing heritability and empowers tomato breeding

代码链接

https://github.com/YaoZhou89/TGG/tree/main/4.Graph_pangenome/1.construction_graph_genome

minimap2用conda安装

用conda 去搜deepvariant是能够搜到的,但是安装一直没有成功,最后是用的singularity(singularity的路径问题还是没太明白,有时间需要学习singularity)

https://github.com/google/deepvariant/tree/r1.6.1

代码语言:javascript
复制
singularity pull docker://google/deepvariant:1.6.1

示例数据就用草莓T2T那篇文章的数据,自己的基因组和自己的hifi数据做比对,hifi数据只取一部分作为练习

minimap2比对

代码语言:javascript
复制
minimap2 -ax map-pb -a -k 19 -O 5,56 \
-E 4,1 -B 5 -z 400,50 -r 2k --eqx \
--secondary=no Fv.fa pra.fq.gz > aln.sam

这里用到了好多参数,有时间仔细看每个参数具体是什么意思

这里还提到了samblaster软件

https://github.com/GregoryFaust/samblaster

运行这一步遇到了报错,暂时没有解决,先运行下一步

代码语言:javascript
复制
samtools sort -@ 12 -O BAM -o aln.sorted.bam aln.sam

samtools index aln.sorted.bam

DeepVariant

代码语言:javascript
复制
singularity run ~/my_data/myan/deepvariant/deepvariant_1.6.1.sif \
/opt/deepvariant/bin/run_deepvariant --model_type PACBIO \
--ref Fv.fa \
--reads aln.sorted.bam \
--output_vcf output.vcf.gz \
--output_gvcf output.g.vcf.gz \
--sample_name abc \
--num_shards 24

接下来用到了WGS这个软件

https://github.com/YaoZhou89/WGSc

可以对vcf文件进行各种操作

在vcf文件中随机选择多少行,这里没有头文件

代码语言:javascript
复制
~/my_data/myan/biotools/WGSc-master/bin/WGS --model file --type random --file output.vcf.gz --headLine 25 --r 0.1 --out random.vcf

计算vcf文件中每个位点的深度

代码语言:javascript
复制
~/my_data/myan/biotools/WGSc-master/bin/WGS --model vcf --type calTotalDP --file output.vcf.gz --out random.dep

但是这个结果好像不对,这个值对应的是GP的值,不是DP的值

这个软件还有很多功能,可以参考github主页的文档

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2024-05-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 小明的数据分析笔记本 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 论文
  • 代码链接
相关产品与服务
容器服务
腾讯云容器服务(Tencent Kubernetes Engine, TKE)基于原生 kubernetes 提供以容器为核心的、高度可扩展的高性能容器管理服务,覆盖 Serverless、边缘计算、分布式云等多种业务部署场景,业内首创单个集群兼容多种计算节点的容器资源管理模式。同时产品作为云原生 Finops 领先布道者,主导开源项目Crane,全面助力客户实现资源优化、成本控制。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档