如何在字段计算器实现重复内容标记?

一、在Excel里去掉列中重复内容的行,可以先对列进行排序然后用IF(CW2=CW1,CX1+1,1)函数实现判断出, CX列中出现1表示第一次出现,大于1则为重复内容(需删除),这就是字段唯一值计算判断的一种方法。

二、Python脚本里设置一个全局变量列表或字典,把字段的内容扔进列表或字典中,利用已有的计数函数count(列表),就可以统计出类似Excel里排序后的重复项判断。字典中不存在该内容,添加,已存在不加,保证字典里是唯一值,然后进行标记。

以上是我对实现字段唯一值的一些想法,下面贴出列表的一种方法:

#function说明 :把个数统计大于1的给计算出来

l=[]

def adjReapeat(fz):

global l

l.append(fz) #把字段每一个内容放到列表中

return l.count(fz) #利用列表的count函数计算出出现该内容的总数,大于1的说明已经出现过,为重复项。实现了类似于Excel里的排序后上下行内容对的比重复次数。

  • 发表于:
  • 原文链接:http://kuaibao.qq.com/s/20180129G1E0G200?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券