有一些关于在ggplot中绘制累积密度的帖子。我目前正在使用来自Easier way to plot the cumulative frequency distribution in ggplot?的被接受的答案来绘制我的累积计数。但是这个解决方案需要预先计算这些值。
在这里,我正在寻找一个纯粹的ggplot解决方案。让我们来展示一下我到目前为止所拥有的:
x <- data.frame(A=replicate(200,sample(c("a","b","c"),1)),X=rnorm(200))
ggplot的stat_ecdf
我可以使用ggplot的stat_ecdf
,但它只绘制累积密度:
ggplot(x,aes(x=X,color=A)) + geom_step(aes(y=..y..),stat="ecdf")
我想做一些类似以下的事情,但它不起作用:
ggplot(x,aes(x=X,color=A)) + geom_step(aes(y=..y.. * ..count..),stat="ecdf")
cumsum
和stat_bin
我发现了一个关于使用cumsum
和stat_bin
的想法
ggplot(x,aes(x=X,color=A)) + stat_bin(aes(y=cumsum(..count..)),geom="step")
但如您所见,下一种颜色不是从y=0
开始,而是上一种颜色结束的地方。
我所要求的
我想要的从最好到最坏:
ggplot(x,aes(x=X,color=A)) + geom_step(aes(y=..y.* ..count..),stat="ecdf")
stat_ecdf
的更复杂的方法。
cumsum
方法,因为它产生更差的(二进制)结果。https://stackoverflow.com/questions/18379933
复制相似问题