我有一个熊猫DataFrame,列代表一个分类变量。我怎样才能得到这些类别的清单?我在列中尝试了.values,但这并不返回唯一的级别。
谢谢!
发布于 2018-09-19 11:37:48
我认为需要Series.cat.categories或unique
np.random.seed(1245)
a = ['No', 'Yes', 'Maybe']
df = pd.DataFrame(np.random.choice(a, size=(10, 3)), columns=['Col1','Col2','Col3'])
df['Col1'] = pd.Categorical(df['Col1'])
print (df.dtypes)
Col1 category
Col2 object
Col3 object
dtype: object
print (df['Col1'].cat.categories)
Index(['Maybe', 'No', 'Yes'], dtype='object')
print (df['Col2'].unique())
['Yes' 'Maybe' 'No']
print (df['Col1'].unique())
[Maybe, No, Yes]
Categories (3, object): [Maybe, No, Yes]发布于 2020-02-29 11:23:47
您也可以使用value_counts(),但是只有当您将它与列名一起使用时,它才能起作用,而您也可以使用它来获取每个类别的计数。示例:
dataframe['Columnn name'].value_counts()或者,如果要计算变量中类别的总数,则可以这样做:
dataframe['Columnn name'].value_counts().count()发布于 2020-01-03 06:40:09
尝试执行以下代码。
List_Of_Categories_In_Column=list(df['Categorical Column Name'].value_counts().index)
https://stackoverflow.com/questions/52404971
复制相似问题