学习
实践
活动
专区
工具
TVP
写文章

绘图:单基因在多个组织中的表达

GTEx数据库(https://www.gtexportal.org/home/) 可以看某个基因在多个组织中的表达,以WASH7P为例:

回车后是这样子的

这张图可以定制,如果组织多了,可以通过tissue选择少一点

这张图可以下载

下载后是svg格式,意味着可以在AI里面二次修改,定制。

但是,这个图是没有统计信息的,看一眼可以,发表文章需要自己修改。

那我们今天就下载原始数据来定制化绘图,正好练习一下数据框的增删改查。

首先,下载数据,一个是表达量数据,一个是注释数据

进入这个网址https://www.gtexportal.org/home/datasets

下载这两个数据

进入Rstudio开始操作:

读入表达量数据,因为是gct文件,这个文件在GSEA那里出现过,要把前两行去掉

这个数据很大,所以我只取前100行来操作

即使是这样这样的小数据,一般的小电脑也不要直接打开看数据,我在这个数据里面再截取一部分来看

可见,行是组织样本,列是基因,不符合ggplo2的输入格式,所以我们要调整一下

最后的数据是这个样子的

上面的那个对于数据框的转置操作,很常用,所以我把他转变成了一个小函数

测试一下写成的小函数,是完全OK的

开始正式处理数据

选取一部分数据出来看看,发现是符合要求的, 进入下一步,

增加注释信息,因为目前每个组织给的都是代号,我们要知道每个代号表示的是什么组织

我们拿点数据出来看一下,多了一列

保存一下数据,这里保存的是Rdata,意味着以后读入特别方便,

我思维里面一个突破就在这个地方

R语言里面的数据,不要老是写出写进的,就让数据在内部流动,出了图才算结束。

下面进入画图环节,还用前两次用的R包“ggstatsplot”

开始!!!

WASH7P基因在心脏里面的表达

WASH7P基因在皮肤里面的表达

WASH7P基因在食管里面的表达

其实我更加在意的是在乳房,睾丸和子宫里面的表达,这是生命起源的地方。

假如有人也想练习一下这个小绘图,我把画图文件已经上传,回复“乳房练习”即可。

然后在R语言里面load一下,数据就进去了,直接进入画图流程。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180721G0K79I00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

关注

腾讯云开发者公众号
10元无门槛代金券
洞察腾讯核心技术
剖析业界实践案例
腾讯云开发者公众号二维码

扫码关注腾讯云开发者

领取腾讯云代金券