当我在一个列上执行value_counts操作时,有没有人看到和/或理解我在pandas中计数的以下错误,我验证了该列只有数字表示为string对象?试图找出导致这种情况的原因;这是我第一次看到这种情况。col12334...<repr(<pandas.core.series.Series at 0x819a0d0>) failed
对于熊猫数据,我知道我可以在一个或多个列上分组,然后过滤出现的值多/少一个给定的数字。
但是我想在数据仓库上的每一列上做这件事。我想移除不频繁的值(比方说,发生的次数少于5% )或太频繁的值。作为一个示例,考虑具有以下列的dataframe:city of origin, city of destination, distance, type of transport (air/car/