我想要的是Nans最终是整数值。因为我的数据集是1000 s的列,所以我不能仅仅更改几个列来使它们成为整数,当我尝试在Dask中使用df = df.astype('int')
时,在将值更改为0之后,无论出于什么原因,它都不能工作。`
下面的值在Pandas中全部恢复为浮动;在Dask中,只有部分列的零值恢复为浮动。我想,如果我能解决这个问题在潘达斯,那么它很可能也会解决它在达斯克(手指祈祷)。
import pandas as pd
import numpy as np
data = [['tom', 10, 15000], ['nick', 15, 12000], ['juli', 5, 20000]]
# Create the pandas DataFrame
df = pd.DataFrame(data, columns = ['Name', 'Age', 'salary'])
import numpy as np
df = df.replace(5, np.nan)
df = df.replace(12000, np.nan)
expanded = df.replace(np.nan, '0')
expanded = expanded.replace('0', 0)
expanded
发布于 2022-05-26 11:32:03
IIUC:
from dask.dataframe import from_pandas
ddf = from_pandas(df, npartitions=2)
out = ddf.select_dtypes('number').fillna(0).astype('int64')
输出:
>>> out.compute()
Age salary
0 10 15000
1 15 0
2 0 20000
https://stackoverflow.com/questions/72396970
复制相似问题