我正在使用这个名为na的Dataframe,在这里,我只过滤了丢失的值,这些值都包含在d列中
genuine a b c d e f
23 True 171.94 103.89 103.45 NaN 3.25 112.79
75 True 171.60 103.85 103.91 NaN 2.56 113.27
210 True 172.03 103.97 103.86 NaN 3.07 112.65
539
目标是用从同一列中选择的随机数填充列中的NaN值。 我可以一次只处理一列,但在迭代数据框中的所有列时,我会遇到各种错误。当我使用"random.choice“时,我得到的是字母而不是列值。 df1 = df_na
df2 = df_nan.dropna()
for i in range(5):
for j in range(len(df1)):
if np.isnan(df1.iloc[j,i]):
df1.iloc[j,i] = np.random.choice(df2.columns[i])
df1 对如何继续前进有什么建
我的df如下所示:
a b c d e f
1 na 2 3 4 5
1 na 2 3 4 5
1 na 2 3 4 5
1 6 2 3 4 5
如何裁剪和重塑数据帧,以使每一列的n/a都被删除,并且数据帧如下所示:
编辑;
df.dropna()正在删除所有行。
a b c d e f
1 6 2 3 4 5
这个数据帧有数百万行,我需要能够逐列删除n/a行,同时保留其中包含数据的行和列。
编辑;
df.dropna()正在删除列中的所有行。当我检查n/a的列是否为空时,df.column_name.empty()返回false。因此,在n/a的列中有数据
我喜欢在pandas dataframe中填充na,其中dataframe中的两列都在同一行上。 A B C
2 3 5
Nan nan 7
4 7 9
Nan 4 9
12 5 8
Nan Nan 6 在上面的数据框中,我希望将列A和列B都有Nan的行替换为“不可用”。 因此: A B C
2 3 5
Not available not available 7
4 7 9
Nan 4 9
12 5 8
Not available not available 6 我尝试了多种方法,但得到了不想要的结果