前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >如何从TCGA数据库下载体细胞突变数据(somatic mutation)

如何从TCGA数据库下载体细胞突变数据(somatic mutation)

作者头像
生信交流平台
发布2022-09-21 19:28:12
9440
发布2022-09-21 19:28:12
举报

前面给大家介绍了新版的TCGA数据库,通过文字和视频给大家讲解了如何从TCGA数据库下载RNAseq数据和miRNAseq数据

新版TCGA数据库RNAseq数据下载

新版TCGA数据库miRNA数据下载

以及如何合并成矩阵

【视频讲解】R代码合并新版TCGA中RNAseq表达谱矩阵

【视频讲解】R代码合并新版TCGA中miRNA表达谱矩阵

零代码合并新版TCGA中RNAseq和miRNA表达谱

我们经常会在SCI文章里面看到下面这样的图来,展示体细胞突变(somatic mutation)的数据。

这个图叫瀑布图,展示每一样本中的各种类型的突变,包括错义突变,移码突变,无义突变,插入缺失等等。要想画出这张图,首先我们必须要准本好数据。今天小编就来跟大家聊聊怎么从TCGA数据库下载体细胞突变(somatic mutation)数据。

1.打开TCGA网站,输入需要下载的肿瘤类型

2.点击WXS后面的数字51

3.点击左上角File

4.选择WXS,Masked Somatic Mutation,maf,simple nucleotide variation,Aliquot Ensemble Somatic Variant Merging and masking,然后Add all files to cart

5.这51个文件就加入右上角的购物车里面了

6.下载sample sheet和Download下拉框里里面的Cart

得到两个文件

gdc_download_20220418_080408.481174.tar.gz和gdc_sample_sheet.2022-04-18.tsv

7.新建一个文件夹,名叫TCGA_CHOL_maf

在TCGA_CHOL_maf下面再建一个文件夹叫maf

将gdc_sample_sheet.2022-04-18.tsv拷贝到TCGA_CHOL_maf中,重命名为maf_sample_sheet.tsv。

将gdc_download_20220418_080408.481174.tar.gz拷贝到maf中解压

TCGA_CHOL_maf文件夹结果如下

TCGA_CHOL_maf/maf文件夹结构如下

那么到这里,我们就下载好了胆管癌的体细胞突变的数据了。下一期内容,我们将使用R代码将这些数据合并成一个矩阵,为绘制瀑布图做准备。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-07-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信交流平台 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档