--MORE-->
背景:统计重复值
在一个Series数据中经常会出现重复值,我们需要提取这些不同的值并且分别计算它们的频数:
import numpy as np
import pandas as...0 语文
1 数学
1 数学
0 语文
0 语文
1 数学
1 数学
0 语文
dtype: object
type(df1) # Series数据
pandas.core.series.Series...cat.values
s
['语文', '数学', '语文', '语文', '语文', '数学', '语文', '语文']
Categories (2, object): ['数学', '语文']
type(s)
pandas.core.arrays.categorical.Categorical...Categorical对象
通过pandas.Categorical来生成
通过构造函数from_codes,前提是你必须先获得分类编码数据
# 方式1
df2["subject"] = df2[...中不同的类别都是它的一列,看下面的例子:
data4 = pd.Series(["col1","col2","col3","col4"] \* 2, dtype="category")
data4
0