.to_numpy()是pandas库中的一个函数,用于将DataFrame或Series对象转换为NumPy数组。
该函数不会将字符串值带入数组中,而是将字符串值转换为NaN(缺失值)。
例如,如果有一个DataFrame对象df,其中包含字符串值和数值值:
import pandas as pd
df = pd.DataFrame({'A': ['foo', 'bar', 'baz'], 'B': [1, 2, 3]})
使用.to_numpy()函数将df转换为NumPy数组:
array([[nan, 1],
[nan, 2],
[nan, 3]], dtype=object)
注意到字符串值被转换为NaN。
在实际应用中,如果需要在转换为NumPy数组时保留字符串值,可以先将字符串列的数据类型更改为object类型:
df['A'] = df['A'].astype('object')
array([['foo', 1],
['bar', 2],
['baz', 3]], dtype=object)
以上是针对.to_numpy()函数的解释和使用示例,希望对您有帮助。
领取专属 10元无门槛券
手把手带您无忧上云