我正在尝试删除电子邮件地址的重复值,只保留pandas数据帧列中的第一个原始值。然而,并不是所有的案例都有电子邮件地址,所以它们都有'NaN‘值。我需要根据不同的标准删除重复的NaN值。现在,我希望保留与NaN相同的所有电子邮件地址,以及重复电子邮件地址的单个唯一副本。例如,下面是pandas数据帧的样子: E
当数据实际上是数字的时候,Pandas中的DataFrame被当作一个对象来处理。我该如何解决这个问题?我假设发生这种情况是因为我的列中有一些不是数字的值--我正试图将这些值转换为NaN。当我尝试运行to_numeric函数时,它以NaN的形式返回所有内容,这不是我所期望的。想象一下我的数据看起来像是X Y Z 53X Y Z 22
X Y Z 6/5