最近在画热图(heatmap
)时,遇到一个问题,就是如果画热图时导入的基因过多,基因名就会重叠在一起,根本没法看,非常影响颜值。😭
这里提供一种基于ComplexHeatmap
的解决方案,大家往下看吧。👇
rm(list = ls())
library(tidyverse)
library(circlize)
library(ComplexHeatmap)
这里我们随机生成一个矩阵,200
行,10
列。😘
expr <- matrix(rnorm(2000), nrow = 200)
rownames(expr) <- paste0("gene", 1:200)
colnames(expr) <- paste0("sample",1:10)
我们先做个归一化处理,如果你的数据已经做过了,就不用做了。🤗
expr_scaled <- t(scale(t(expr)))
基因名(行名
)全都堆在一起了,根本没法看。😭
当然你可以选择扩大画布,来显示出基因名。🤨
Heatmap(expr_scaled,
row_names_gp = gpar(fontsize = 4),
column_names_gp= gpar(fontsize = 8)
)
假设我们需要标注gene1
,gene10
,gene100
到gene106
,以及gene180
。👀
gene <- paste0("gene", c(1,1, 10, 100:106, 180))
这里我们需要找到这些基因在原始矩阵的位置。🤒 为了保险起见,我们把对应的基因名也从中提取出来。🤜
genemark <- which(rownames(expr_scaled) %in% gene)
labs <- rownames(expr_scaled)[genemark]
我们把上面搞定的位置和相应文本整理成注释文件,作为行注释。🤨
ha <- rowAnnotation(
foo = anno_mark(at = genemark,
labels = labs,
labels_gp = gpar(fontsize = 8)
))
解决啦! 现在这些基因名就没有再“挤”在一起啦,嘿嘿。
Heatmap(expr_scaled,
cluster_rows = F,
right_annotation = ha,
show_row_names = F,
row_names_gp = gpar(fontsize = 4)
)
这里换一个我个人常用的配色,并对样本进行聚类注释。🥰
class <- anno_block(
gp = gpar(fill = c("#E64B35E5", "#4DBBD5E5", "#00A087E5", "#3C5488E5"),
col="white"),
height = unit(5, "mm"),
labels = c("Cluster A", "Cluster B", "Cluster C","Cluster D"),
labels_gp = gpar(col = "white", fontsize = 8,fontface="bold")
)
clusters <- HeatmapAnnotation(group = class)
哈哈哈哈哈哈哈,美不胜收呀!~🤩 妈妈再也不用担心我的热图注释“挤”在一起啦!!!🤜
Heatmap(expr_scaled,
## row parameters
cluster_rows = F,
right_annotation = ha,
show_row_names = F,
show_row_dend = F,
row_names_gp = gpar(fontsize = 4),
## column parameters
column_split= 4,
column_title = NULL,
column_names_gp = gpar(fontsize = 8),
top_annotation = clusters,
## color
col = colorRamp2(c(-2,0,2), c("#6395C7", "white", "#E06EAD")),
## legend
name = "Exp",
rect_gp = gpar(col="grey")
)
最后祝大家早日不卷!~