布隆过滤器的优化：布隆过滤器 gu***a？

dfnjsfkhak 2024-02-25 128 0

今天给各位分享布隆过滤器的优化的知识，其中也会对布隆过滤器 gu***a进行解释，如果能碰巧解决你现在面临的问题，别忘了关注本站，现在开始吧！

本文目录一览：

预防和解决缓存穿透问题，可以考虑以下两种方法：缓存空对象：将空值缓存起来，但是这样就有一个问题，大量无效的空值将占用空间，非常浪费。

如果非要用这种方式来解决穿透问题的话，尽量将无效的 key 的过期时间设置短一点比如 1 分钟。另外，一般情况下我们是这样设计 key 的：表名：列名：主键名：主键值。

（图片来源网络，侵删）

多次执行，结果一致，根据结果判定：内存的存储存在局限性，可以使用redis中的bitMap来实现字节数组的存储。使用redis实现布隆过滤器。需要根据公式，手动计算字节数组的长度和哈希的个数。实现过程，待完善。。

因为布隆过滤器的不可逆，我们没法重新建一个更大的布隆过滤器然后去把数据重新导入。这边***取的扩容的方法是，保留原有的布隆过滤器，建立一个更大的，新增数据都放在新的布隆过滤器中，去重的时候检查所有的布隆过滤器。

布隆过滤器内部维护一个bitArray（位数组），开始所有数据为0，当一个元素过来时，能过多个哈希函数（hashhashhash3）计算不同的hash值，并通过hash值找到bitArray的下标，将里面的值改为由0变为1。

（图片来源网络，侵删）

如布隆过滤器通过4字节存储（布隆过滤器通过多次hash对数据计算后--几次hash根据数据量指定，得到多个数据，占用多个位），则占用空间为610M。比原有空间少一半。个人觉得，此比较在字符等的比较中尤为有效。

这种情况也造成了布隆过滤器的删除问题，因为布隆过滤器的每一个 bit 并不是独占的，很有多个元素共享了某一位。如果我们直接删除这一位的话，会影响其他的元素。

布隆过滤器（英语：Bloom Filter）是 1***0 年由布隆提出的。它实际上是一个很长的二进制向量和一系列随机映射函数。主要用于判断一个元素是否在一个***中。

（图片来源网络，侵删）

布隆过滤器是一种数据结构，概率型数据结构，特定是高效插入和查询，可以用来告诉你“某一值一定不存在或者kennel存在”。相比于传统的map、set等数据结构，占用空间更少，但其返回结果是概率型的，不确定。

从上式中可以看出，当m增大或n减小时，都会使得误判率减小，这也符合直觉。现在计算对于给定的m和n，k为何值时可以使得误判率最低。

布隆过滤器可以用于检索一个元素是否在一个***。它的优点是空间效率和查询时间都比一般的算法要好得多，缺点是有一定的误识别率和删除困难。

布隆过滤器只会把正常的URL当成黑名单系统里的，但不会误报已经在黑名单里的URL。形象点说就是“宁可错杀三千不会放过一个”在讲解布隆过滤器原理之前先讲位图。位图是bit类型的数组。

布隆过滤器（Bloom Filter）是1***0年由[布隆]提出的。它实际上是一个很长的[二进制]向量和一系列随机映射函数。布隆过滤器可以用于检索一个元素是否在一个***中。

关于布隆过滤器的优化和布隆过滤器 gu***a的介绍到此就结束了，不知道你从中找到你需要的信息了吗？如果你还想了解更多这方面的信息，记得收藏关注本站。

转载请注明出处： http://www.twgdfm.com/post/14619.html