我必须匿名地执行ip地址连接统计,因为这些数据具有安全风险,那么我该如何做呢?
就像这样,ip号码和网络被随机码取代,当操作员整理统计数据时,他只能看到代码?
但是,后端软件有ip号,用于更新统计数据。我应该对这些数据进行加密并立即生成代码吗?
或者,我可以用压缩数据的方式,对数字进行分组,例如根据他们的国家,例如,我有属于英国"hashedipaddr“=> "GB”的ip号码代码,对于这个随机组,将分配多个ip号码。
发布于 2012-08-04 17:25:09
如果你收集的数据和“我以前见过这个IP”一样简单?那么布卢姆滤波器是理想的。Bloom过滤器查找和插入都是O(1)。但最重要的是,你不能逆转一个花过滤器,甚至不使用蛮力,因为不可避免的假阳性率。您可以有一个布卢姆过滤器数组,以将ip地址放入类别,例如将所有美国geo查找放在相同的bloom筛选器中。
密码散列函数或非对称密码术不太理想,因为它很容易强求如此小的密钥空间。
https://security.stackexchange.com/questions/18123
复制相似问题