我正在尝试使用pd.read_excel将主要数字数据的大量.xls和.xlsx文件读入python。但是,这些文件使用em-dash缺少值。我试图让Python将所有这些em-dashes替换为nans。我似乎无法找到让Python甚至可以识别角色的方法,更不用说替换它了。我尝试了以下不起作用的内容
df['var'].apply(lambda x: re.sub(u'\2014','',x))
我也试过了
df['var'].astype('float')
将数据框中的所有em-dash转换为nans,同时将数字数据保持为浮点数的最佳方法是什么?
相似问题