我是第一次接触熊猫,这是我的第一个笔记本。我需要连接我的数据帧的一些列,在那之后,我想要分离这些值,以便更好地可视化它们。
为了连接列,我使用了df['Q7'] = df[['Q7_Part_1', 'Q7_Part_2', 'Q7_Part_3', 'Q7_Part_4', 'Q7_Part_5','Q7_Part_6','Q7_OTHER']].apply(lambda x : '_'.join(x.dropna().astype(str)), axis=1)
,它做得很好,但是我仍然需要分隔值,为此我使用了explode()
,比如:df.Q7 = df.Q7.str.split('_').explode('Q7')
,这给了我一些数据框上的空单元格,比如:Dataframe,当我试图可视化这些值时,它们就变成了空的,比如:sum of empty cells
我该怎么做才能不在viz上显示这些空单元格?
编辑1:顺便说一下,当我这样做时,它们不会显示为null或NaN单元格:df.isnull().sum()
或df.isna().sum()
发布于 2021-03-03 19:32:48
c = ['Q7_Part_1', 'Q7_Part_2', 'Q7_Part_3', 'Q7_Part_4', \
'Q7_Part_5','Q7_Part_6','Q7_OTHER']
df['Q7'] = df[c].apply(lambda x : '_'.join(x.astype(str)), axis=1)
我无法复制您的问题,但我最好的猜测是,如果您执行上述操作,列表的维度将保持不变,并且您将获得字符串'nan‘值而不是空字符串。
https://stackoverflow.com/questions/66463227
复制