前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >跟着MER学数据分析:利用ont三代测序数据组装植物叶绿体基因组

跟着MER学数据分析:利用ont三代测序数据组装植物叶绿体基因组

作者头像
用户7010445
发布2023-08-23 10:48:02
2850
发布2023-08-23 10:48:02
举报
文章被收录于专栏:小明的数据分析笔记本

论文

Plastid Genome Assembly Using Long-read data

https://onlinelibrary.wiley.com/doi/epdf/10.1111/1755-0998.13787

还有一篇对应的论文

https://www.biorxiv.org/content/10.1101/2023.06.27.546741v1.full.pdf

Phylogenetic placement of Ceratophyllum submersum based on a complete plastome sequence derived from nanopore long read sequencing data

对应的github主页

https://github.com/Bean061/ptgaul

软件直接用conda安装就可以

使用也非常简单

代码语言:javascript
复制
ptGAUL.sh -r /path/Beta.fasta -l ont.fq -t 8 -f 3000 -o ./ptgaul/

需要指定一个参考序列,github主页上写到这个参考序列来自同属或者同科的叶绿体基因组序列都可以

软件运行非常快,基本上10分钟就能拿到组装结果,手头有数据的可以试试

这个流程首先使用minimap2将ont数据比对到参考的叶绿体基因组,然后生成paf文件,然后根据paf文件去过滤比对上的reads,然后选取50X的reads去组装,组装用到的软件是flye,我试了一下我自己手头的数据,初次比对然后过滤比对到参考基因组序列的reads大约都在1000X作用,我自己手头的ont数据文库长度应该是在20k作用,之前记得ont的8k文库好像很便宜了,不知道用8k文库的数据来组装叶绿体基因组效果怎么样

学习一下这个流程的代码,主要学习怎么根据paf格式的文件提取比对到的reads

推文记录的是自己的学习笔记,很可能存在错误,请大家批判着看

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-07-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 小明的数据分析笔记本 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 论文
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档