我看了这个问题的变体,但没有找到worked...so在这里的答案。我有很多数据框,每个数据框代表一个心理指数(他们问几个问题,它们的平均值给你一个关于你正在测量的东西(愤怒,焦虑,等等)的分数)。在本例中,我将选择其中的三个: SA、SE、GT
我想创建一个for循环来自动计算每个数据帧中列的平均值,然后使用该平均值添加一个新列。
我可以为一个数据帧创建一个for循环来做这件事,但是我该如何循环这个循环来为我所有的数据帧(比3多得多)做这件事呢?
#This is the for loop to do it for just one data frame (SA)
avg <- c()
我有一个pandas数据帧,我想在数据帧的末尾添加一行以显示每列的平均值;但是,由于Col2、Col3和Col4中的平均值,NaN函数无法返回列的正确平均值。如何解决此问题? Col1 Col2 Col3 Col4
1 A 11 10 NaN
2 B 14 NaN 15
3 C 45 16 0
4 D NaN 16 NaN
5 E 12 23 5 附注:这是取平均值
假设我们有下表(称为numbers):
Name A B C
Jon 1 3 0.33
Sue 4 4 1
Jon 5 5 1
我想修改这个表,使其包含一个新的列D,它是特定于每个人的列C的平均值。例如,Jon出现两次,因此它们的C平均值为0.33 + 1 / 2 = 0.665。因此,我希望将0.665添加到Jon中。同样的原则也适用于数据库中的其他名称,因此结果如下所示:
Name A B C D
Jon 1 3 0.33 0.665
Sue 4 4 1 1
Jon 5 5 1 0.665
你知道该怎么做吗?我尝试过ALTER TABLE numbers AD
我在一个数据帧中有一系列的数据帧。
顶层数据帧的结构如下:
24hr 48hr 72hr
D1 x x x
D2 x x x
D3 x x x
在每种情况下,x都是使用pandas.read_excel()创建的数据帧
每个x数据帧中的一列具有标题‘平均血管长度’,并且在该列中有三个条目(即行、索引)。
我想返回的是“平均血管长度”列的平均值。我还对如何返回该列中的特定单元格感兴趣。我知道有一个用于pandas数据帧的.mean方法,但我不知道使用它的索引语法。
下面是一个例子
import pandas as
我在计算pandas数据帧中列的一部分的平均值时遇到问题。我需要将我的数据框分成子窗口,并且我需要每个较小窗口的平均值。
目前,我的代码如下所示:
array2 = np.array([[x[:,0].mean()]
for x in np.array_split(array1, 10)])
因此,目前我将array1划分为10个子数组。现在我的问题是:出于某种原因,我将"nan“作为某些方法的解决方案。这可能是由于array1中必须有一些NaN值的原因。我怎么能只计算非nan值的平均值,而根本不从array1中删除nan呢?这个是可能的吗?非常感谢!: