前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >100篇泛癌研究文献解读之非编码区调控元件的突变情况

100篇泛癌研究文献解读之非编码区调控元件的突变情况

作者头像
生信技能树
发布2019-05-20 17:35:23
7160
发布2019-05-20 17:35:23
举报
文章被收录于专栏:生信技能树生信技能树

为了分析不同类型、组织起源肿瘤的共性、差异以及新课题。TCGA于2012年10月26日-27日在圣克鲁兹,加州举行的会议中发起了泛癌计划。参考:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6000284/ 为此我也录制了系列视频教程在:TCGA知识图谱视频教程(B站和YouTube直达)

发表于 Nat Genet. 2014 Nov, 文章是 Genome-wide analysis of noncoding regulatory mutations in cancer. 本研究专注于分析那些有全基因组测序的肿瘤样本,不到一千个。采取3个研究策略:

  • hotspot analysis focused on small regions that frequently contained mutations;
  • regional recurrence analysis identified annotated regions that contained numerous mutations;
  • transcription factor analysis nominated regions with ETS transcription factor binding sites that were disrupted or created by mutation.

大多数的研究都集中在肿瘤用来产生蛋白的基因组部分,即蛋白编码基因。蛋白就像细胞机器一样发挥作用。当它们正常地运作时,蛋白执行良好的健康所需的细胞任务。但是当蛋白不能正常地工作时,包括癌症在内的疾病可能就会产生。然而,表达蛋白的基因仅占整个基因组的1%至2%,更多未知的信息都存储在剩余的98%基因组区域,只有真正的全基因组测序数据才能探索到。

文献解读属于100篇泛癌研究文献系列,首发于:http://www.bio-info-trainee.com/4132.html

病人数量及癌症肿瘤

分布如下:

ROIs的突变数量分布

关于genomic regions of interest (ROIs)

包括:

  • 经典生物学包括: gene,intron,exon,CDS,UTR
  • 表观生物学包括: CpG,promoter,enhancer
  • 其它: insertions/deletions, copy number variants, differentially methylated regions, transcription factor binding sites (TFBSs), and 3D interacting regions

国际著名的 International Human Epigenome Consortium (IHEC) 包括:ENCODE, NIH Roadmap Epigenomics, FANTOM5, BLUEPRINT 通常喜欢把ROIs链接到邻近基因来代表它的功能,基于一个很简单的理论,这个ROIs在基因附近,那么它自然而然的可以影响该基因的行为。熟悉命令行工具的研究者可以用bedtools等工具,不熟悉的也有ColoWeb这样的网页工具。

本文采用Ensembl v70 数据库定义CDS,UTR区域,然后启动子区域是TSS的上游2Kb和下游200bp,还有 66 944 enhancer-region 也来源于数据库。

如下:

Transcription factor analysis.

在ENCODE数据可以得到 3个EST酶( EHF, ELF1 and ETS1) 都是可以结合 SDHD 启动子区域的, 所以SDHD 启动子区域突变会影响它被ELF1的调控。

SDH是一个四聚体酶(4个亚基分别由SDHA, SDHB, SDHC, SDHD基因编码) ,本文重点描述的是SDHD基因,它的启动子区域的突变可以把melanoma 分组,mutations (n = 13; red) 和 wild-type (WT) SDHD (n = 42; blue) ,表达量差异很显著:

而且突变与否,完全决定了它与ELF1基因的表达量相关性,这个 ETS transcription factor (ELF1)

而且具有临床意义:

后记

本研究比较容易重复,只使用1000多个WGS数据的突变信息和表达量信息,关键是作者如何重海量数据里面定位到SDHD 和 ELF1 这个关系。

当然了,如果你想超脱于他们的泛癌计划已经发表的研究,那么就非常有必要跟着我读完这100篇泛癌文献!

详见我的100篇泛癌研究文献解读目录:http://www.bio-info-trainee.com/4132.html

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-05-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 病人数量及癌症肿瘤
  • ROIs的突变数量分布
  • Transcription factor analysis.
  • 后记
相关产品与服务
命令行工具
腾讯云命令行工具 TCCLI 是管理腾讯云资源的统一工具。使用腾讯云命令行工具,您可以快速调用腾讯云 API 来管理您的腾讯云资源。此外,您还可以基于腾讯云的命令行工具来做自动化和脚本处理,以更多样的方式进行组合和重用。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档