让我们假设我在Python中有一个DataFrame,它显示了不同单元的业务部门负责人的名称,随着时间的推移,。它可以看起来类似于,并且可以重新创建如下:import numpy as np
d = pd.DataFrame({'Boss_January': ['Nina,即跨不同列的值不完全相同的<
我正在尝试使用Pandas和Pyarrow来获取数据。我有数百个拼板文件,它们不需要有相同的模式,但是如果跨parquets的列匹配,它们必须具有相同的数据类型。我遇到的情况是,产生的拼花数据类型不是我想要的那样。例如,我可能会将一个int64写到一个列中,产生的拼图将是double格式的。我试过导入numpy然后用这种方式包装值-
import numpy as