我想将dataframe保存到.h5文件MainDataFile.h5:
df.to_hdf ("c:/Temp/MainDataFile.h5", "MainData", mode = "w", format = "table", data_columns=['_FirstDayOfPeriod','Category','ChannelId'])
并得到以下错误:
*例外:找不到正确的原子类型-> > [dtype->object,items->Index(‘Libellé_条文’,‘Libellé段’,dtype='object')]
如果我以这样的方式修改列'Libellé_Article‘:
df['Libellé_Article'] = str(df['Libellé_Article'])
不再存在错误,而在执行以下操作时仍然会收到错误消息:
df['Libellé_Article'] = df['Libellé_Article'].astype(str)
问题是使用str()会炸掉我的内存。
知道吗?
发布于 2015-05-07 02:21:14
str(df['Libellé_Article'])
将将整个列的内容转换为单个字符串。最后会有一根很大的绳子。这就是炸掉你的RAM的原因
例如
>> df = pd.DataFrame([1,2,3], columns=['A'])
>> df['A']
0 1
1 2
2 3
Name: A, dtype: int64
>> str(df['A'])
'0 1\n1 2\n2 3\nName: A, dtype: int64'
>> df['A'].astype(str)
0 1
1 2
2 3
Name: A, dtype: object
因此,如果要将整个列转换为字符串,则应仅使用.astype(str)
。
发布于 2022-03-10 00:27:10
.astype(str)
是Pandas系列的方法,str()
是函数。.astype(str)
将在系列上工作,而不是在int上工作,而str()
将同时处理这两个方面。https://stackoverflow.com/questions/30095172
复制相似问题