前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >WGS分析及检测建议

WGS分析及检测建议

作者头像
用户7625144
发布2024-07-15 12:38:51
700
发布2024-07-15 12:38:51
举报
文章被收录于专栏:生信开发者

WGS最近又成为了风口,但WGS分析很难,相信坚持难而正确的事,一定会有收获。下边是本人近期总结的一些WGS的分析思路心得。

  1. 可根据计算资源、时间和成本考虑对SNV、CNV、ROH(Trio样本分析是否是UPD及亲本来源,IBD计算父母亲缘关系远近),动态突变、转座元件插入(Mobile Element Insertion,MEI)、SV、线粒体变异、HLA分型、病原感染等项目做分析
  2. SNV、exonic/monogenic CNV、MEI(Mobile Element Insertion)等可批次joint calling且一起用vcf格式合并、用VEP做注释,用slivar(https://github.com/brentp/slivar)分析遗传来源,这样可以更好地分析不同类型变异构成的复合杂合情况
  3. 对于隐性遗传的基因,如果是Trio样本,则优先把有可能构成复合杂合的P、LP的排序在前面
  4. 效率优先的原则,建议优先过滤出虚拟WES区域和已知(HGMD/Clinvar)中P/LP/VUS的点
  5. WGS对分析SMA、DMD、α地贫、CAH、甚至F8的内含子倒位都有一定的准确性或提示作用,这些一般具有高发病率或高携带率,有必要建立单独分析的流程,也许有些不一定能100%准确,但我们也已差不多99%以上能搞定了
  1. 所有 intronic/intergenic区预测影响剪接(比如spliceAI预测的)的位点有overlap的其他变异(比如CNV 比如MEI)最好都保留下
  2. WGS的CNV分析应该基于三种分析思路
    1. 第一种是基于低深度CNVseq的用连续唯一比对的滑动窗口分析测序深度相比正常对照样本比值的变化,也可结合SNV的分布的pattern一起联合分析(是否有连续的ROH,是否有连续的0.33或0.66的分布)
    2. 第二种是基于SV的split reads和discordant read pair、local assembly 等信号分析提示的
    3. 第三种可用WES的MANE转录本的外显子区域作为虚拟WES的捕获区域,用类似WES-CNV的分析思路去分析外显子区域的CNV,因为coding region的CNV更重要
  3. SV的过滤策略很重要,建议把SV分析出来的deletion、duplication与inversion、translocation等区分开来分析,基于joint calling的inversion、translocation基于断点理论上可采用与SNV类似的过滤和注释逻辑
  4. WGS直接做balanced translocation carrier还是有难度,如果有非平衡易位先证者,或者有核型能锁定 cytoband区域的话,去看父母平衡易位携带情况会比较容易一点,直接去找平衡易位的话,很难确定是否是真的,因为call出来SV太多了

WGS目前基本没有医院有自主能开机工厂化的测序仪(如T7、Novaseq6000 或者T20 、Novaseq X Plus等)的样本量,四款测序仪,T7单张芯片产1.4T(实际一般能产1.6-1.8T),WGS测40x(120G)的话,单张芯片最少可测13个样本,这种机器价格昂贵,固定资产投入高,单次上机产出数据量多,开机试剂成本较高,没有形成稳定的样本流之前建议都是外送测序工厂比较方便,以后建库测序也基本全交给了自动化,WGS预计在未来一两年很有可能大量取代WES,前段时间某测序服务厂商已推出了6.99¥/G的T20测序价格,按120G计算的话测序价格控制在了840¥,WGS的wetlab成本 应该基本控制在了1000¥出头了,相信接下来一两年内WGS将快速取代WES进入临床应用。并不是因为WGS比WES诊断率能高很多,但因为其相比WES更快速更低成本的建库、加速软件赋能生信分析,测序成本下降,更全面的变异分析维度,和越来越高效、精准的生信工具的迭代,WGS的价值越来越高。

但生信二级分析和三级解读以及数据存储将成为瓶颈,按胎儿WGS专家来算的话,存储5年,将是不小的成本。建议用fastq压缩工具将fastq.gz格式做进一步压缩保存,中间环节用cram格式取代bam,用vcf.gz或bcf取代vcf格式。

本人已从上一个单位离职了,后续如果大家有WES/WGS/CNVseq/中深度CNVseq数据分析、panel设计和定制(比如定制自己的携带者筛查panel)、特殊基因/疾病分析(如SMA、DMD、α地贫、CAH、甚至F8的内含子倒位等)、三代测序数据分析、大队列科研数据分析、生信平台搭建、服务器软/硬件架构设计、二级生信分析+三级解读报告系统一体机等需求,加我微信:491537314

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-07-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信开发者 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据保险箱
数据保险箱(Cloud Data Coffer Service,CDCS)为您提供更高安全系数的企业核心数据存储服务。您可以通过自定义过期天数的方法删除数据,避免误删带来的损害,还可以将数据跨地域存储,防止一些不可抗因素导致的数据丢失。数据保险箱支持通过控制台、API 等多样化方式快速简单接入,实现海量数据的存储管理。您可以使用数据保险箱对文件数据进行上传、下载,最终实现数据的安全存储和提取。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档