文章/答案/技术大牛

发布

社区首页 >问答首页 >为什么我的标识符碰撞率在增加？

问为什么我的标识符碰撞率在增加？
EN

Stack Overflow用户

提问于 2014-05-21 22:13:38

回答 1查看 111关注 0票数 1

我使用IP +用户代理的散列作为每个访问网站的用户的唯一标识符。这是一个简单的方案，有一个非常明显的陷阱：标识符冲突。多个人使用相同的IP +用户代理组合浏览互联网。由相同哈希标识的唯一用户将被识别为单个用户。我想知道这个标识符出错的频率。

为了计算频率，我创建了一个理论上应该转换为零的两步漏斗：publish.click > signup.complete。(用户在发布之前必须注册。)运行这个漏斗1天，我的转换率为0.37%。我想，这个数字是那个漏斗的唯一标识符碰撞概率。查看原始数据(一个大约10,000行长的表)，我证实了这个假设。37名注册由新用户完成，与在漏斗期间(1天)完成publish.click的旧用户相同的哈希标识。(我之所以知道这一点，是因为散列在漏斗之间匹配，而在注册时分配的did则不匹配。)

我以为我把一切都解决了..。

但随后我运行漏斗1周，转化率提高到0.78%。5个月后，转化率为1.71%。

这里可能起什么作用？为什么我的转换(碰撞)速率随着实验周期的延长而增加？

我认为这可能与这样一个事实有关:唯一的用户通常只触发signup.complete一次，而他们可能在一段时间内多次触发publish.click。然而，我很难用语言表达这一假设。

任何帮助都将不胜感激。

hash

collision

identifier

hash-collision

user-tracking

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-05-23 18:04:00

可能的解释从最简单的开始：

碰撞率是相对稳定的，但你的初步测量并不明显，因为你得到的正面的数量很少。37不是很多。在这种情况下，您有两个不错的数据点。
碰撞率不是很稳定，并且随着时间的推移，随着使用的变化(在工作中，在家里，在使用手机等)。有三个数据点显示出上升趋势，这只是一个巧合。这不会让我感到惊讶，因为漏斗的转换率会随着时间的推移而显著变化，特别是每周一次。还有我们还没抓到的机器人。
如果您真的得到多个发布，并且注册绝对是一次性的事情，那么您的碰撞率将增加，因为用户只注册，而没有发布最终发布。这不会增加他们的漏斗转换，但它将为其他人提供一个额外的发布进行转换。本质上来说，每一次额外的发布都会增加我作为一个新用户与以前的发布事件混淆的可能性。

来自执行部分的便条。假设3被证明是正确的假设。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/23794746

复制

相似问题

问为什么我的标识符碰撞率在增加？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问为什么我的标识符碰撞率在增加？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问为什么我的标识符碰撞率在增加？
EN