前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >redis 学习(14)-- HyperLogLog

redis 学习(14)-- HyperLogLog

作者头像
希希里之海
发布2019-06-03 08:37:07
3000
发布2019-06-03 08:37:07
举报
文章被收录于专栏:weixuqin 的专栏weixuqin 的专栏

HyperLogLog

什么是 HyperLogLog

HyperLogLog 是基于 HyperLogLog 算法的一种数据结构,该算法可以在极小空间完成独立数量统计。

在本质上还是字符串类型。

重要 API

命令

含义

pfadd key element1 [element2...]

向HyperLogLog中添加元素

pfcount key1 [key2...]

计算HyperLogLog的独立总数

pfmerge destKey key1 [key2...]

合并多个hyperLogLog到destKey中

演示

内存消耗

以百万独立用户为例

代码语言:javascript
复制
elements = ""
key = "2019_06_02:unique:ids"
for i in `seq 1 1000000`
do 
  elements = "${elements} uuid-"${i}
  if [[$((i%1000)) == 0 ]]
  then
    redis-cli pfadd ${key}${elements}
    elements = ""
  fi
 done

内存消耗

1 天

15 KB

1 个月

450 KB

1 年

15KB * 365 = 5 MB

可以看到内存消耗是非常低的,比我们之前学过的 BitMap 还要低得多。

使用经验

Q:既然 HyperLogLog 那么好,那么是不是以后用这个来存储数据就行了呢? A:这里要考虑两个因素:

  1. hyperloglog 的错误率为:0.81%,存储的数据不能百分百准确。
  2. hyperloglog 不能取出单条数据。api 中也没有相关操作。

如果你没有这两个方面的顾虑,那么用 HyperLogLog 来存储大规模数据,还是非常不错的。

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2019-06-02 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • HyperLogLog
  • 什么是 HyperLogLog
  • 重要 API
  • 演示
  • 内存消耗
  • 使用经验
相关产品与服务
对象存储
对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档