假设我有一个有几百行的频率表。
Group Score Frequency
A 0 12687
B 0 9965
A 1 4567
B 1 3520
A 2 963
B 2 1024
A 3 985
B 3 1124
Continue with more rows
我如何计算每组得分的平均值和标准差,并对R中两组的平均得分进行t检验?
我有一只大熊猫的资料被读为table。我想计算两个不同组的均值和标准差,CRPS和Age,这样我就可以用std偏差作为误差条在条形图中绘制它们。
我可以得到由Age列计算的平均值。我想这是一个必须构造的for循环,但是我不知道如何比table["Age"].mean()**,(只给出所有数据点的年龄值的平均值)更远的构造。这就是我需要指导的地方。我想看看组列,告诉它计算该组年龄的平均值和标准差。例如,** CRPS 组的年龄的平均值和标准差值。
下面有前25行,只是为了显示dataframe的样子。我还进口了numpy as np。
Group Age
0
我有一个名为timings的表,其中我们存储了100万个响应时间用于负载测试,现在我们需要将这些数据分成100组,即前500条记录作为一组,依此类推,并计算每组的百分位数,而不是平均值。
到目前为止,我尝试了这个查询
Select quartile
, avg(data)
, max(data)
FROM (
SELECT data
, ntile(500) over (order by data) as quartile
FROM data
) x
GROUP BY quartile