除了画弦图，circlize竟然能这样用？

百味科研芝士

发布于 2019-05-23 23:02:40

3.2K1

发布于 2019-05-23 23:02:40

文章被收录于专栏：百味科研芝士百味科研芝士

背景介绍

这张图来自于一篇对胎盘母胎界面的细胞互作研究[1]，这篇文献筛选出了所有细胞表达的配体和受体，利用现有的数据库找到配体-受体对，用箭头将这些细胞表达对应的配体-受体对连接起来，从而推断出不同类型细胞间的互作关系。

从外至内的第二圈7个色块展示的是细胞类型，最外圈展示它们所表达的配体和受体，红绿色块表示该基因的表达水平，黑色箭头表示母胎细胞间的互作，灰色箭头指的是细胞滋养层间的互作。

如果你对这种图感兴趣的话，那就跟我一起画一画吧！

目的

利用细胞表达的配体和受体，将它们的互作关系模型用圆圈图展示出来。

方法

读取文件

df = read.csv('cordblood.csv',header = T)

这个文件共有5列，三个分类标准：分别是第一列细胞类型cell；第二列配体还是受体lr；第三列基因名gene。最后一列fc为我们数据的具体数值foldchange值，也就是差异倍数。gene_id只起一个序号的作用，方便之后画图使用。

整体布局与初始化

首先加载包，调整画布范围，避免基因标签出界（默认画布大小为c(1,1)c(1,1)）。circlize的画图逻辑一定是从外至内一圈圈地叠加，并且最外圈的半径一定是1，因此若要在最外圈的外面添加内容的话，我们的画布半径要比1大，这里设置为1.1。

library(circlize)

# circos.clear() #这个命令用于清空画布，画错时要运行此命令重新再画。

#整体布局

circos.par(canvas.xlim =c(-1.1,1.1),canvas.ylim = c(-1.1,1.1),cell.padding = c(0.02,0,0.02,0))

画第一圈

画第一圈一定要使用circos.initialize进行初始化，初始化需要设定factors。factors可以粗暴地理解为最外圈有多少个方块种类。我们这里要将每个基因的fc值用色块表示出来，有多少行就画多少个小色块，因此使用的factor就是gene_id。这里为什么不用gene呢？是因为不同的细胞中会表达相同类型的基因，如此一来得到的factor就少了。

fa = df$gene_id

fa = factor(fa,levels = fa)

circos.initialize(factors = fa, xlim = c(0,1)) # 初始化

这一行运行完之后你还不会看到任何东西，因为它只是在画布上设定了一个轨道（track），把每一块位置计算分割好了，并没有填充内容，下面我们来将这一圈填充内容。

circos.trackPlotRegion是绘画的关键，trackPlotRegion顾名思义就是在轨道上的区域上作画。参数说明：

track.height设置圆圈环的宽度，比如说0.15就表示这是一个外圈半径为1内圈半径为0.85的环（前面说了最外圈半径一定为1）。

bg.border设置每个区域的边界颜色。

bg.col设置每个区域的填充颜色，这里填充的是根据fc值大小所对应的黑-黄-红过渡颜色。

# 设置fc的大小对应的颜色，随着颜色从黑到黄到红过渡，fc值从-10至0至10

col_fun = colorRamp2(c(-10, 0, 10), c("black", "yellow", "red"))

circos.trackPlotRegion(

ylim = c(0, 1), track.height = 0.15, bg.border = 'black', bg.col = col_fun(df$fc),

panel.fun = function(x, y) {

sector.index = get.cell.meta.data('sector.index')

xlim = get.cell.meta.data('xlim')

ylim = get.cell.meta.data('ylim')

} )

给每个区域加上标签——它们的基因名。用circos.axis命令设置label。

sector.index即我们的区域索引第四列gene_id，

labels指的是具体要标注上去的内容，也就是第三列基因名。

其他的参数是调整标签的字体大小（labels.cex）、颜色（col）、方向（labels.facing）之类的。

# 标注基因

for(i in 1:nrow(df)){

circos.axis(sector.index= df[i,4], direction = "outside", labels=df[i,3],

labels.facing = "clockwise",labels.cex=.58, col = 'black',

labels.away.percentage=0.1, minor.ticks=0, major.at=seq(1, length(df$gene)))

}

画第二圈细胞类型

还是用circos.trackPlotRegion进行绘画，圆圈环的宽度还是0.15。根据每个细胞类型对应的gene_id号进行上色，用highlight.sector给它们进行高亮以及标注。这里注意 track.index = 2，选择高亮第二圈。font设置字体大小，col为区域填充色。niceFacing为标注字体的方向是不是方便人类阅读。大家可以自行尝试一下niceFacing = T会有什么不同的样子。

# 第二圈细胞类型

circos.trackPlotRegion(

ylim = c(0, 1), track.height = 0.15, bg.border = NA,

panel.fun = function(x, y) {

sector.index = get.cell.meta.data('sector.index')

xlim = get.cell.meta.data('xlim')

ylim = get.cell.meta.data('ylim')

} )

# cell

highlight.sector(as.character(df$gene_id[1:11]), track.index = 2,

text = 'B cell', niceFacing = F, font = 2, col = '#CCEBC5')

highlight.sector(as.character(df$gene_id[12:75]), track.index = 2,

text = 'mon,neu,eos ', niceFacing = F, font = 2, col ='#FFFFB3')

highlight.sector(as.character(df$gene_id[76:142]), track.index = 2,

text = 'others', niceFacing = F, font = 2)

highlight.sector(as.character(df$gene_id[143:170]), track.index = 2,

text = 'T cell', niceFacing = F, font = 2, col = '#FFCC99')

highlight.sector(as.character(df$gene_id[171:196]), track.index = 2,

text = 'NK', niceFacing = F, font = 2, col = '#ccccff')

画第三圈配体与受体

这次设置的track.height为0.08，窄一点。这一圈的绘画原理同第二圈，找出每个区域对应的编号范围，进行高亮。text.col设置标注颜色。代码看上去很长，但其实找到规律看一行就够了。

#第三圈配体受体

circos.trackPlotRegion(

ylim = c(0, 1), track.height = 0.08, bg.border = NA,

panel.fun = function(x, y) {

sector.index = get.cell.meta.data('sector.index')

xlim = get.cell.meta.data('xlim')

ylim = get.cell.meta.data('ylim')

} )

#红蓝配

highlight.sector(as.character(df$gene_id[1:6]), track.index = 3,

text = 'ligand', niceFacing = F,col = '#FB8072',text.col = 'white')

highlight.sector(as.character(df$gene_id[7:11]), track.index = 3,