我有一个pandas数据帧,我想在数据帧的末尾添加一行以显示每列的平均值;但是,由于Col2、Col3和Col4中的平均值,NaN函数无法返回列的正确平均值。如何解决此问题? Col1 Col2 Col3 Col4
1 A 11 10 NaN
2 B 14 NaN 15
3 C 45 16 0
4 D NaN 16 NaN
5 E 12 23 5 附注:这是取平均值
因此,我正在研究R的矩阵,如下所示:
diff_0
SubPop0-1, SubPop1-1, SubPop2-1, SubPop3-1, SubPop4-1,
SubPop0-1, NA NA NA NA NA
SubPop1-1, 0.003403100 NA NA NA NA
SubPop2-1, 0.005481177 -0.002070277
由于很难解释的原因,我想在一只熊猫数据仓库中平均每一组细胞,这些数据都是随机值填充的。dataframe总是有sqrt(列数x索引数)值--其余的都是NaN。这些值是近似均匀分布的,因此,如果我平均适当大小的单元格块,我希望每个块中有一个值。
这是我的例子。对于100个列和100个索引,我有100个值随机分布在dataframe中。我期望每10x10块有~1值,其余的值都是NaN。如何将每个10x10块转换为一个单元格(其中的10列、10个索引和值的平均值)?
我的代码:
import pandas as pd
import numpy as np
import math
number_of
我有一列数据,类似于"0.496,0.424,0.141“。现在,我想将它们转换为数字,并计算平均值。有人能告诉我怎么做吗?提前谢谢你。
string1 <- "0.496,0.424,0.141"
#I have try
mean(as.numeric(string1))
#but it didnot work
我有很大的数据,里面有很多副本。第一、第二、第二、第四、第二、第三、第三、第四诸若此类。
现在,我为每一组复制平均值创建了一个新的dataframe。
下面的代码可以工作,但是它非常笨拙,特别是cbind和collumname设置非常难看。
# first i create the new dataframe
data.mean<- data.frame(matrix(nrows=30))
# iterate over every third collumn
for(col in seq(1,length(colnames(data)), by=3)){
# create a
与和相关
考虑一下这个数据
import pandas as pd
import numpy as np
df = pd.DataFrame(index=range(10))
df['a'] = [ 3 * x for x in range(10) ]
df['b'] = [ 1 -2 * x for x in range(10) ]
根据 for aggregate,您应该能够指定使用如下所示的dict聚合哪些列:
df.agg({'a' : 'mean'})
回传
a 13.5
但是,如果您尝试使用用户定义的函数(如此函
我在为一些很简单的事情而挣扎。我试图找出矩阵子集的平均值。例如,我希望找到矩阵中每一行的最后196个元素的平均值。
我的代码如下:
for (i in 1:length(ratios))
{
mean(ratios[length(ratios[,1])-196:length(ratios[,1]),i])
}
任何帮助都将不胜感激!
我正在从一个DataFrame文件中读取hdf5:
import pandas as pd
store = pd.HDFStore('some_file.h5')
df= store['df']
store.close()
使用info显示:
In [11]: df.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 21423657 entries, 0 to 21423656
Data columns (total 5 columns):
date datet