这是我的数据的一个小样本:
顶行包括表示不同树种的代码(例如PJ =杰克松)。这些数值表示调查样地中每个物种的计数。每个案例代表一个林分,由森林管理者(B)评估一次,然后由管理政府机构(A)进行基于地块的调查审计。我想在R中使用chisq.test来确定两个样本来自同一总体的概率,本质上比较来自源A和源B的结果。对于每种情况,我希望将0值转换为NA,其中A和B源都有0。否则我就是在不必要地夸大测试的自由度。我对R很陌生。
我想在许多情况下进行卡方检验,整个数据集包含多达15个物种。在大多数情况下,需要处理2-7个物种。
谢谢你的帮忙
发布于 2017-08-24 19:50:29
您可以使用tidyverse
函数并尝试执行以下操作:
df %>%
group_by(Case) %>%
mutate( PJ = if_else(sum(PJ) == 0, NA, PJ))
这样做的目的是,如果两个Source
的度量值都为0
,则和为0,然后将该组的值替换为NA。它消除了将数据转换为宽格式的需要。
另外,可以同时查看mutate_at
到mutate
多个列。
https://stackoverflow.com/questions/45860543
复制相似问题