我正在找一封特别的信来检查替换是否正确。
df = pd.read_excel(io = "mydata.xlsx", sheet_name = 'Sheet1', index_col = 0)
df
header = df.select_dtypes(['object']).columns # to get the str type columns only
df[header].apply(lambda x: x.str.replace(pat=r'[^\w]', repl=r'', regex=True)) # and replace them with black ''若要查看带有特殊字母的列:
df_header = df[header]
df_test2 = df_header[['PCETC_DTL','WARNSPEAK4DTL','WARNBEHAV4DTL','WARNEMOTION4DTL','WARNSIGN_DTL','EVENT_DTL','EVENT_DTL_2']]
df_test2[df_test2.apply(lambda x: x.str.contains('w', na=False))]我得到了结果:
PCETC_DTL WARNSPEAK4DTL WARNBEHAV4DTL WARNEMOTION4DTL WARNSIGN_DTL EVENT_DTL EVENT_DTL_2
EXCLUDE
1_3 NaN NaN NaN NaN NaN NaN NaN
NaN NaN NaN NaN NaN NaN NaN NaN
NaN NaN NaN NaN NaN NaN NaN NaN
NaN NaN NaN NaN NaN NaN NaN NaN
NaN NaN NaN NaN NaN NaN NaN NaN
... ... ... ... ... ... ... ...
1_3 NaN NaN NaN NaN NaN NaN NaN
1_3 NaN NaN NaN NaN NaN NaN NaN
1_3 NaN NaN NaN NaN NaN NaN NaN
1_3 NaN NaN NaN NaN NaN NaN NaN
1_3 NaN NaN NaN NaN NaN NaN NaN
104959 rows × 7 columns我怎么能看到只有“w”的行?
发布于 2022-09-22 04:02:43
可以使用any聚合每行布尔值,以便只选择至少一个w的行。
df_test2[df_test2.apply(lambda x: x.str.contains('w', na=False)).any(1)]如果要同时筛选行和列:
df2 = df_test2.apply(lambda x: x.str.contains('w', na=False))
df_test2.loc[df2.any(1), df2.any()]https://stackoverflow.com/questions/73808648
复制相似问题