我有一个由nba游戏统计数据组成的熊猫数据集。
数据如下所示:
Date|Team 1|Team 2|Team1 Stats|...|Team2 Stats|...
由于我收集数据的方式,我现在有两个例子的每场比赛,其中每个队的统计数据只是镜像。
(所有条目都相等-只有Team1统计数据在Team2列中,反之亦然)
我如何找到和删除重复的条目使用熊猫。
发布于 2017-11-13 19:10:49
若要删除重复项,只能保留Team1在Team2字典之前的情况。
dfFiltered=df[df["Team1"]<df["Team2"]]
假设一支球队从来没有玩过自己的游戏,这是可行的。
https://stackoverflow.com/questions/47271709
复制相似问题