让我给你们看一个简单的例子:
对于示例数据集中的“age”列,我们可以轻松地使用value_counts()函数来计算观察到的年龄数据集的数量。...因此,它无法正确地应用value_counts()等函数。那么,我们该怎么做呢?我将在下面向您展示!...你的字符串是这样的吗:“[‘strawberry’, ‘apple’, ‘orange’]”?
在这种情况下,有一个使用apply()和eval()函数的快速方法。...[', '["')
list_ = list_.replace(']', '"]')
return list_
应用到dataframe时,请使用此伪代码:
df[col] = df[...因为列不代表一个标记,而是一个级别,大多数在标签上的操作不能正确地完成。例如,计算香蕉和桃子之间的相关性是不可能的,我们从方法1得到了dataframe。如果这是你的研究目标,使用下一种方法。