前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >中国人肝癌全基因组项目

中国人肝癌全基因组项目

作者头像
生信菜鸟团
发布2024-03-18 14:04:20
1590
发布2024-03-18 14:04:20
举报
文章被收录于专栏:生信菜鸟团

Title

Deep whole-genome analysis of 494 hepatocellular carcinomas

Online

https://www.nature.com/articles/s41586-024-07054-3

研究背景

先前的中国人肝癌研究队列规模有限,且集中在WES,对于 WGS 上研究较少。PCAWG 大规模的全基因组研究因为测序深度较浅而无法完全分析肝癌基因组的亚克隆结构。因此作者开展了 Chinese Liver Cancer Atlas(CLCA)中国人肝癌图谱项目。

研究方法

  • 病人和样本:494个肝癌病人都进行了 WGS 测序,肿瘤样本平均测序深度120x,正常对照样本是36x。还有 239 例进行了 RNAseq
  • 分析流程:在call 突变是用了经典流程,后面的驱动突变、拷贝数变异在文章中有详细介绍。

研究结果

  • 体细胞突变图谱:共鉴定出了9287828个体细胞突变,其中的驱动基因分为:编码区(23个)和非编码区(31个),有10个驱动突变是具有显著性的克隆或亚克隆突变
  • 突变特征分析:17个单碱基取代(SBS)、3个双碱基取代(DBS)和8个小插入和缺失(ID)特征。与COSMICv3.2相比,五个特征是新的:SBSH8,DBSH1和DBSH2,IDH3和IDH8。其中SBSH8特征中,JAK1和CTNNB1是最主要的编码驱动因子,ALB启动子是最主要非编码驱动因子。
  • HBV 和 ecDNA分析:在进行拷贝数变异分析时,发现有 27.3% 存在 ecDNA,且ecDNA 中检测到了 76 个癌基因。生存分析发现 ecDNA 存在的患者预后较差。
  • 值得注意的是,该项目的部分分析数据有对外开放,且是以数据库的形式:http://lifeome.net:8080/clca/#/ ,可以在网页上进行探索,也下载后可以进一步析,数据包括:病人的临床信息、体细胞突变结果,突变特征、拷贝数变异、结构变异、ecDNA

虽然文章中提到鉴定出来的突变有 9287828个,数据库主页也显示如此。但是进入 mutation 界面却只看到 283223 个突变,点击右上角下载得到的 Excel表格(可以简单处理为maf格式),显示的也只有 283223个突变位点。

每个样本突变数量也和作者上传的文件不一致:

看到这个比例约为3%,也就是目前人类基因组已知的区域的比例。比如通常的全外显子测序,就只测1.5%~ 3% 左右的基因组区域,其余的非编码区或者未知的区域一般不测。所以得到的9287828个突变位点,只有 283223个约3%的突变位点可以被注释到。

在开放的数据中,可以看到突变类型的注释信息比较个性化,和ensemble标准(如VEP或ANNOVAR的注释类型)不一致:

代码语言:javascript
复制
  1. > somatic = rio::import("Mutations.xlsx")
  2. > table(somatic$Classification)
  3. 3'UTR 5'UTR frameshift deletion
  4. 73142 20544 1971
  5. frameshift insertion lncRNA lncrna.prom
  6. 698 48380 10845
  7. nonframeshift deletion nonframeshift insertion nonframeshift substitution
  8. 435 66 409
  9. nonsynonymous SNV promoter splicing
  10. 52418 67674 2349
  11. startloss stopgain stoploss
  12. 158 4001 133

在简单处理后,将所有突变读入 maftools 之后,同样展示驱动基因的突变图谱:

感兴趣的读者可以基于该数据集进一步探索和挖掘。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-03-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信菜鸟团 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 研究背景
  • 研究方法
  • 研究结果
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档