首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

生物信息学数据库使用教程:cBioPortal数据库使用教程

cBioPortal介绍

使用cBioPortal数据库可以先阅读关于该数据库的文章:

The cBio cancer genomics portal: an open platform for exploring multidimensional cancer genomics data.

Integrative analysis of complex cancer genomics and clinical profiles using the cBioPortal.

大规模的癌症基因组计划,比如The cancer genome atlas(TCGA) and the International cancer genome consortium(ICGC),正在从多技术平台产生更多的癌症基因组数据。这使得这些数据的整合,探索和分析越来越具有挑战性,尤其是对于没有计算机背景知识的科学家来说。cBioPortal是专门设计来降低对这些复杂数据的接近门槛,因此,促进基因组数据向新的生物学视野,治疗和临床特征的转变。

cBioPortal这个网站,促进多维度癌症基因集数据的探索,可以允许跨基因,样本和数据类型的可视化分析。用户可以可视化一个癌症研究中多样本间基因改变的模式,并比较点多癌症研究中基因改变频率,或者在一个个体肿瘤样本中总结概括所有的相关的基因组改变。这个网站也支持生物通路探索,生存分析,基因改变间的相互独特性分析,可选择性的数据下载,编程接口和可以用于发表的可视化总结。

整合进cBioPortal的基因组数据类型包括体细胞突变,DNA copy-number alterations(CNAs),Mrna和microRNA(miRNA)表达,DNA甲基化,蛋白质富集,磷酸化蛋白富集。目前,网站包含从10个出版的癌症研究的数据集,包括癌症细胞系百科全书,多于20个研究在TCGA流程。对没有一个肿瘤样本,数据是可以从多基因组数据分析平台可获取的。网站的简化概念是在基因水平整合多种数据类型,然后询问每个sample中专门的生物学事件的呈现(例如,基因突变,基因纯和删除,基因扩增,上调或下调的mRNA或miRNA),蛋白的上下调等。这使得用户可以查询每个gene和每个样本的的遗传学改变,并检验复发(某些特殊癌症)。

下面我们介绍该数据库的使用教程

主页面介绍

左侧区域是各种癌症组织的研究,数字表示某肿瘤中研究个数,比如,该数据库中乳腺癌有15个研究,中间是所有研究,可根据左侧栏选择,默认显示全部,最右侧是对该数据库中274个癌症研究的案例统计,显示前20个,可通过点击(details)查看,下表列出了每个癌症研究和数据类型的可用样本数量。

我们选择乳腺癌,中间窗口就只出现乳腺癌相关的研究,总共有15个。我们选择入侵乳腺癌的第二个研究,该研究有70个样本,然后点击Explore Selected Studies

新页面是该研究的数据可视化,部分截图如下:

下图是基因组拷贝数和突变数的统计,鼠标放在点上可显示数据。

左侧是突变基因,#Mut是突变的总样本数,#是有一个或多个突变的样本数,Freq表示突变频率。

cytoband表示该基因在染色体上的位置,CNA表示拷贝数改变,其他同上。

下图是关于突变数的一些统计图

切换到临床数据页面,有关每个病人的详细描述。可点击下载按钮下载数据。

切换到CN Segments窗口,为所选的70个样本分割拷贝数数据。可点击下载按钮下载数据。

切换到首页页面,我们还可以通过基因检索。

当输入gene sets分析的时候,用户可以手工输入HUGO gene symbols,Entrez gene ids,gene aliase或从预先定义的自己感兴趣的gene sets或pathways中选择。系统也会给我们选择一些常见通路的基因。

我们选择TP53通路,会自动将该通路的基因填入框中。点击提交。

然后会得到我们输入的基因在每个病人/样本中的突变情况。

行代表gene,列代表samples。图标和颜色代表代表不同的基因型改变,包括突变,CNAs(amplifications扩增,homozygous deletions纯合子缺失),基因或蛋白丰度改变。把鼠标放到每一个小标志上,可以看到关于caseID(代表一个病人sample或cell line)等的详细信息,点击样本号可以进入该sample的详细信息,包括年龄性别还有gene等详细情况。对于突变evens,这显示了氨基酸的改变。默认情况下,cases按alterations进行排序。用户可以重新排序,比如字母,caseID,等。用户也可以选择移除未改变的cases从可视化图中。通过可视化一系列cases中的gene改变,oncoprints可以帮助鉴定比如gene sets中的相斥或共发生事件。

一旦submit按钮按下,oncoprint结果会自动显示。

如果genes不适合window,会有水平滑动条。

为了让oncoprint更紧凑,有三个选择可以进行自定义,(i)使用zoon bar进行尺度缩小放大(ii)通过选择view下去反选“show unaltered cases”移除没有改变的cases(iii)反选view下的show whitespace between columns移除samples之间的gaps。

在sort中改变显示顺序

可以输出oncoprint,选择下载成xml文件,in scalable vector graphic(SVG)格式。

如果想修正或开始查询,选择结果面板上的“modify query”。若要获得额外的详细信息,那就动下你的鼠标到小标志上面吧。

在癌症类型summary面板,

在Mutual exclusivity面板,The analysis tested 6 pairs between the 4 tracks in the OncoPrint。

Plot面板可以用来可视化数据,比如临床状态和突变数。

在Mutation窗口,显示基因的突变信息。

当然还有很多其他功能,自己探索一下!

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20191111A0KAV900?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券