腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何在Scala中对bloom filter建模
、
、
、
、
我
正在尝试在Scala中为bloom filter建模。逻辑本身实际上非常简单,但我正在努力弄清楚如何充分利用Scala
的
数据结构,使其更好、更实用、更实用。
我
的
问题是:如果
我
使用一个case类,
我
需要
构造
函数
来生成
哈希
函数
和存储实际
布
隆
过滤器
数据
的
位数组。但是,在像"add“这样会更改位数组内容
的
方法中,
我<
浏览 45
提问于2019-03-04
得票数 0
回答已采纳
1
回答
如何将hashfunction输出映射到bloomfilter索引?
、
、
、
谁能帮我概述一下
哈希
函数
输出是如何映射到
布
隆
过滤器
索引
的
?这是关于
的
概述。
浏览 0
提问于2012-07-27
得票数 10
回答已采纳
2
回答
Bloom Filters如何帮助确定URL是否已经爬行?
、
我
不断听到Bloom Filter在web爬行中是如何有用
的
,特别是在确定URL是否已经被爬行时(因为Bloom Filter在测试集成员资格时是内存高效
的
)。然而,在web爬行
的
用例中,如果遇到几乎无限数量
的
URL,那么位/桶
的
数量不是
需要
很多吗?尤其是,如果你是Google或一个搜索引擎,每天都在试图抓取数据。所以我
的
问题是,当URL
的
数量不断增加,而存储桶
的
数量保持不变时,Bloom
过滤器</
浏览 0
提问于2013-06-15
得票数 1
1
回答
假阳性数
布
隆
过滤器
、
、
、
我
实现了一个带有3个
哈希
函数
的
布
隆
过滤器
,现在
我
应该计算该
过滤器
中
的
误报(而不是可能性)的确切数量。有没有一种有效
的
方法来计算?
过滤器
中
的
项数为2亿,位数组大小为4亿
浏览 36
提问于2019-11-23
得票数 0
1
回答
在
函数
数量固定
的
情况下,如何在给定误报概率
的
情况下计算
布
隆
过滤器
的
大小?
、
我
需要
实现一个
布
隆
过滤器
。
我
找不到解决
的
办法。例如,
我
希望
过滤器
有10%
的
假阳性,
我
有number
函数
和集合中元素
的
数量。如何计算匹配误报概率
的
B
浏览 1
提问于2011-12-19
得票数 2
4
回答
布
隆
过滤器
设计
、
、
我
想知道在哪里可以找到Bloom filter
的
实现,以及关于
哈希
函数
选择
的
一些解释。1)已知Bloom
过滤器
具有误报。是否可以通过使用两个
过滤器
来减少它们,一个用于使用
的
元素,另一个用于未使用
的
元素(假设集合是有限
的
,并且先验已知),并比较这两个
过滤器
? 2) CS文献中还有其他类似的算法吗?
浏览 1
提问于2012-01-08
得票数 1
回答已采纳
2
回答
bloom filter实现如何保持干净?
、
既然它们被填满了,假阳性
的
百分比也增加了,那么有哪些技术可以防止它们饱和呢?似乎您不能清空位,因为这将立即对存储在该节点中
的
数据产生负面影响。即使你有一个已知大小
的
集合,在使用像Cassandra这样
的
bloom
过滤器
的
数据存储中,让
我
困惑
的
是节点中
的
数据将被添加和删除,对吧?但是当您删除一个键时,您不能将其bloom filter bucket设置为0,因为这可能会对散列到一个或多个与删除
的
键相同
的</em
浏览 2
提问于2011-08-13
得票数 2
回答已采纳
3
回答
在时间和空间上,哪一个最好: Bloom filter,Hash table还是Dictionary?
我
需要
在C#中存储4000个固定大小(8个字符)
的
字符串,但我不知道添加和检索项目的空间和时间最好使用:
布
隆
过滤器
,
哈希
表还是字典?如果有人能帮我,请告诉
我
浏览 0
提问于2011-01-11
得票数 12
3
回答
位集向量和bloom
过滤器
之间
的
C-差异
、
所以我理解位集向量本质上可以为你在每个位中存储真/假集合,但是
我
对它和
布
隆
过滤器
之间
的
区别感到困惑,
我
知道
布
隆
过滤器
利用散列
函数
并且可以返回误报,但是它们可以存储
的
数据类型/它们可以做
的
函数
的
实际区别是什么
浏览 2
提问于2017-04-24
得票数 0
1
回答
Bloom Filter
的
最佳配置是什么?
我
正在尝试找出Bloomfilter
的
最佳配置。bloomfilter值应该是什么?有没有什么公式可以根据节点、数据大小、读写频率计算出最优数量?
浏览 2
提问于2013-10-19
得票数 0
4
回答
表示稀疏整数集?
、
什么是以紧凑和快速
的
方式表示稀疏整数集(实际上是C内存地址)
的
好方法。
我
已经知道了一些显而易见
的
东西,比如位向量和游程编码。但我想要更紧凑
的
东西,而不是每个set元素一个单词。
我
需要
添加和删除元素,并测试成员资格。
我
不
需要
其他
的
集合操作,比如联合。
我
在很多年前读过一个这样
的
库,但后来忘记了它
的
名字。
我
认为它是由惠普以开源
的
形式
浏览 2
提问于2008-12-11
得票数 13
回答已采纳
1
回答
为什么leveldb
的
bloomfilter
的
位数组
需要
划分为多个filterblock?
、
因为表是打开
的
,所以整个
过滤器
块都会保存在内存中,如果只有一个bloomfilter位数组,会不会更简单?
浏览 13
提问于2018-12-21
得票数 0
1
回答
检查元素是否为集合
的
一部分
的
算法
、
、
、
我
有一个元素列表,
我
希望将这些元素散列在一起以获得根散列(类似于merkle树)。要求是
我
需要
验证一个元素是否存在于根
哈希
中。现在
的
限制是,
我
只能访问根
哈希
和我们
需要
在任何时候验证
的
元素,所以我们不能使用merkle树方法。
我
尝试过
布
隆
过滤器
和类似的算法,但找不到一种方法来处理误报。有没有什么数据结构或算法可以让
我
找到解决方案?
浏览 13
提问于2021-06-07
得票数 0
回答已采纳
1
回答
什么是d-Left计数
布
隆
过滤器
?
、
、
有人能用一种简单
的
方式解释一下d-left计数
布
隆
过滤器
,特别是指纹和残数
的
使用吗? 有没有一个好
的
Python实现呢?
浏览 5
提问于2021-05-20
得票数 0
1
回答
快速查找IPv4集
、
、
、
我
已经做了一些功课,关于哪种数据结构最适合用C实现
的
IPv4地址
的
优化查找。
我
不
需要
键值,只是为了检查它是否存在于一个集合中。
我
不能有误报,所以没有
布
隆
过滤器
。推荐
的
大多数选项(基数树、y-fast树)都用于键值存储。
我
考虑过
哈希
表,但不
需要
存储值,只
需要
一个键.以快速查找为首要考虑
的
最好方法是什么?
浏览 16
提问于2019-12-12
得票数 0
回答已采纳
1
回答
perl持久
布
隆
过滤器
、
我
有一个运行多个perl工作进程
的
系统,所有这些进程都
需要
查找bloom filter。如果
我
使用标准bloom filter perl模块( Bloom::Filter或其他),每个子进程都
需要
添加到bloomfilter中。有没有一种方法可以使用在多个进程之间共享
的
bloomfilter
我
甚至
需要
将数据持久化到磁盘上,因为每次重新启动系统时,
我
都可以重用bloomfilter数据
浏览 7
提问于2016-01-28
得票数 2
1
回答
如何检查旧分区中使用
的
Bloom Filter
、
我
有一个包含一些分区
的
表,最近bloom filter发生了变化。有没有办法查看在旧数据中使用了哪种
布
隆
过滤器
? 据我所知,一旦你改变了
布
隆
过滤器
,只有新
的
数据会受到影响。 诚挚
的
问候
浏览 18
提问于2019-08-26
得票数 0
1
回答
什么是
布
隆
过滤器
的
“快速”
哈希
函数
?
、
假设
我
正在研究和调整
布
隆
过滤器
的
散列
函数
,使用一个可能被广泛接受为“快速”
的
函数
来计算散列所需
的
最大周期数是多少?
浏览 1
提问于2014-01-26
得票数 1
2
回答
Bloomfilter和Cassandra =为什么使用,为什么要多次散列?
、
、
我
读到了这个:1.)Cassandra只使用bloom
过滤器
来找出最有可能包含键
的
SST (排序字符串表),这是正确
的
吗?这是正确
的
吗?(
我
正在尝试理解cassandra是如何工作
的
…) 2.)为什么(在上面的链接中解释)键被散列了几次?密钥
需要
用不同
的
散列
函数
进行多次散列,以获得更好
的
“随机分布”比特,这是正确
的
吗?如果这是错误<
浏览 2
提问于2011-05-01
得票数 7
回答已采纳
0
回答
云redis怎么安装
布
隆
过滤器
扩展?
、
需要
使用redis
的
布
隆
过滤器
,请问怎么安装扩展? [附加信息]
浏览 590
提问于2018-12-20
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
2023-06-11:redis中,如何在100个亿URL中快速判断某URL是否存在?
其实你只需要换一种方式
缓存实战(3)让你彻底搞懂布隆过滤器!实现一个自己的BloomFilter
学习笔记DB4:大数据近似算法
URL 去重的 6 种方案!(附详细实现代码)
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券