如何计算R中的集合标准差?
下面是我的数据集的代码(因为我的数据集包含许多条目,所以我不能在这里复制粘贴它)
install.packages("Sleuth3")
library(Sleuth3)
View(ex0126)
为了求出每个组的平均偏差和标准差(即,单个组是当事方R和D),我使用下面的R代码得到了它。
library(Sleuth3)
ex0126
View(ex0126)
#Average of each group individually for party (R,D)
meanOfR <- subset(aggregate(ex0126[, 4:
在r数据帧上又遇到了一个问题。
#starting position
from <- c("A","B","A","C")
to <- c("D","F","D","F")
number <- c(3,4,6,7)
data.frame(from,to,number)
如何计算两个相同的"from- to“关系(从A到D)的个数?结果应该看起来像我的“结果”数据帧。
#result
from <- c("A","
我想计算R中的标准差,但标准函数"sd(x)“不是我需要的函数。我正在寻找一个函数来计算sd(x,依赖于我的数据帧中的另一个变量)。这样我就可以通过依赖变量(image)添加一个具有sd的新列。如下所示:
image answer sd
a 1 0,70
a 2 0,70
b 2 2,12
b 5 2,12
我有如下所示的数据:
patient day response
Bob "08/08/2011" 5
然而,有时,我们在同一天有几个反应(来自同一个患者)。对于所有这样的行,我希望将它们全部替换为一行,其中患者和日期当然是所有这些行的碰巧值,响应是它们的平均值。
所以如果我们也有
patient day response
Bob "08/08/2011" 6
然后,我们将删除这两行并将它们替换为
patient day response
Bob "08/08/2011" 5.5
如何在R中编写代码,以便对跨越数万行的数据帧执行此操作?
编辑:我可
下面是几行我正在使用的测试数据。我希望计算ICD10Code列中所有字符的频率,这些字符由列分隔。从下面的代码段中,我使用了group_by,因为每个"PatientId“值在该列中都有重复值,但在其他列中有唯一值。如何计算所有字符值的频率?
PatientId ReferralSource NextAppt Age InsuranceName ICD10Code
1584 St Francis Y 34 SLIDING FEE SCHEDULE M5136, N809, R51, Z6831
2655
我是R的新手,我会直接在评论中问这个问题,但我还没有这样的名声:D 基本上,我想做一个sunburst图,就像dmp在这个帖子中建议的那样:How to make a sunburst plot in R or Python? 然而,我的数据帧看起来更像这样: df <- data.frame(
'level1'=c('a', 'a', 'a', 'b', 'b', 'b', 'c', 'c'),
'level2
我有一个SKU -week数据,其中有不同的店内活动(战术)。我想通过策略来总结每个变量。将代码粘贴到SAS中:
proc sql;
create table lp.lp_sku_report1
as select distinct(tactic), sum(Sales_Stat_Case_10_Lt) as Sales_Stat_Case_10_Lt, sum(Sales_Units) as Sales_Units, sum(Sales_Dollars) as Sales_Dollars, sum(Baseline_Stat_Case_10_Lt) as Baseline_Stat_C
例如,我如何才能对1000个单独的随机漫步执行1000步,然后取平均值和标准差?谢谢,很抱歉问了这么多问题。不知何故,我需要将结果列在一个列表中,这样我就可以计算平均值和标准差。
import random
def randomStep(x,y):
r = random.randint(1,4)
if r == 1:
x = x + 1
elif r == 2:
x = x - 1
elif r == 3:
y = y + 1
else:
y = y - 1
return [x,y]
x = 0
y = 0
q = input(int("Pleas
我在我的代码中使用了colSums,但除了总和之外,我还需要标准差。我在互联网上搜索,发现这个页面只包含:
colSums
colMeans
我试过这个:
colSd
但是我得到了这个错误:
Error: could not find function "colSd"
除了标准差,我如何做同样的事情:
colSd
代码如下:
results <- colSums(x,na.rm=TRUE)#### here I want colsd
在R中,我尝试遍历df,如果一列中的数据与其下一行中的数据相匹配,则使另一列中的数据也相匹配。除了考虑下面这样的FOR循环之外,我还没有真正深入到其他地方。其他选择是使用if语句,但我相信有更好的方法。
For (row in 1:nrow(df)){ insert code here maybe}
下面是我的数据示例
id name
1 M1
2 M1
3 M1
4 M2
5 M2
我希望它看起来像这样
id name
1 M1
1 M1
1 M1
4 M2
4 M2