我需要转换一个数据转换程序从编辑器Power Query到Python。我不是很擅长编辑能力查询。
我有一个包含30多列的表,任务如下:
= Table.Distinct(#"Previous task", {"column1"})
当我这样做的时候,它占据了哪一行?第一个?最后一个?是随机的吗?我如何将其转换为Python Pandas,以确保具有相同的数据?
感谢您的答复
发布于 2021-11-24 09:51:32
默认情况下,我相信Table.Distinct会保留第一行。
Table.Distinct
在Pandas中,您可以使用以下内容:
df.drop_duplicates(keep='first', inplace=True)
keep参数指定要保留的行,而inplace参数只是确保对数据帧本身进行更改,而不是对数据帧的副本进行更改。
keep
inplace
在pandas.DataFrame.drop_duplicates上查看更多here。
pandas.DataFrame.drop_duplicates
此外,还将here's一些关于Table.Distinct的更多信息,以及如何在执行操作之前保持表的排序顺序。
https://stackoverflow.com/questions/70093821
相似问题