什么是布隆过滤器，他是怎么防止缓存穿透的，怎么控制误判率-编程知识

什么是布隆过滤器，他是怎么防止缓存穿透的，怎么控制误判率

news/2025/3/29 3:08:45/文章来源:https://www.cnblogs.com/cabbagehp/p/18792862

什么是布隆过滤器

布隆过滤器（Bloom Filter）是一种空间效率很高的概率型数据结构，它可以用来判断一个元素是否属于一个集合。

原理

布隆过滤器本质上是一个位数组，初始时所有位都被置为 0。当一个元素加入集合时，通过多个不同的哈希函数对元素进行计算，得到多个哈希值，然后将位数组中对应的位置为 1。
当查询一个元素是否在集合中时，同样通过这些哈希函数计算哈希值，检查对应的位是否都为 1。如果所有位都是 1，那么该元素大概率在集合中；如果有任何一位为 0，那么该元素一定不在集合中。

特点

空间效率高：相比于传统的数据结构（如哈希表），布隆过滤器在存储大规模数据时占用的空间要小得多。因为它只需要一个位数组来存储数据的特征，而不需要存储数据本身。
存在误判：布隆过滤器的一个重要特点是存在一定的误判率，即可能会将不在集合中的元素误判为在集合中。这是由于不同元素的哈希值可能会产生冲突，导致位数组中的某些位被错误地置为 1。不过，通过合理选择哈希函数的个数和位数组的大小，可以控制误判率在一个较低的水平。
不支持删除：在布隆过滤器中删除元素比较困难，因为删除一个元素可能会影响到其他元素的判断结果。通常的做法是定期重建布隆过滤器来处理元素的删除操作。

如何防止缓存穿透

在缓存系统中，布隆过滤器可以在查询缓存之前快速判断一个数据是否存在，从而避免大量不存在的数据直接穿透缓存访问数据库，减轻数据库的压力。

控制误判率

缓存空值：当布隆过滤器误判元素存在，查询数据库发现不存在时，将该空值结果缓存起来，并设置较短过期时间。这样下次相同查询可直接从缓存返回空值，避免重复经过布隆过滤器和查询数据库。例如在电商系统中查询不存在的商品 ID，可将其空值缓存，在短时间内再次查询时快速响应。
定期重建布隆过滤器：随着数据变化，布隆过滤器误判率可能升高。定期根据最新数据重建布隆过滤器，可降低误判率。重建周期依据数据更新频率和业务需求确定，如每天或每周重建一次。
使用多个布隆过滤器：使用多个布隆过滤器对数据进行过滤，每个布隆过滤器使用不同哈希函数。只有当所有布隆过滤器都判断元素存在时，才认为该元素可能存在，以此降低误判概率。不过会增加内存占用和计算量，适用于对误判率要求极高的场景。
结合其他数据结构辅助判断：结合哈希表等其他数据结构辅助判断元素是否真的存在。当布隆过滤器判断元素存在时，再通过哈希表等进一步确认。例如在用户登录系统中，布隆过滤器判断用户 ID 可能存在后，通过哈希表确认用户的详细信息是否准确，以减少误判影响。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/906035.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

会计学-开篇

介绍是不是觉得会计学极其枯燥，死板，无趣？因为会计准则本身就是人为设定的游戏规则，整个学习过程感觉就是一直在背诵各种条条框框，完全没有创造性。相比之下，不管是数学，编程，物理学，生物学，投资学，都显得很有意思，这些学科都是帮助我们通向创造。而会计学似乎只会…

2 小时，我搭好了“一物一码” 的设备巡检管理系统！

说实话，以前每次看到设备巡检表上那些手写的记录，我就头疼——字迹潦草、容易丢、查起来还费劲。直到昨天下午，我实在忍不了了，决定自己动手搞个"一物一码"的巡检系统。从零到落地，现在所有设备贴个二维码，手机一扫就能查记录、报故障，还能自动生成报表！老…

未达到分数线passAcCode: #include<bits/stdc++.h> using namespace std; int vis[100010]; int main(){int N, K, S, ans = 0;cin >> N >> K >> S;while(N--){int sc1, sc2;cin >> sc1 >> sc2;if(sc1 < 175) continue;if(sc1 >= 17…

GlusterFS 三节点集群部署指南（Heketi 管理模式）

前言：随着信息技术的飞速发展，数据量呈爆炸式增长，传统的集中式存储系统已经难以满足现代应用对存储容量、性能和可靠性的苛刻需求。分布式存储技术应运而生，而 GlusterFS 作为其中的杰出代表，凭借其简单却强大的架构设计，成为了存储领域的一颗新星。 GlusterFS 的魅力不…

性价比拉满！最新的ISP图像处理方案来啦，基于瑞芯微RK3562J全国产工业平台！

今天为大家带来基于瑞芯微RK3562J工业平台的ISP图像处理方案，不仅低成本、低功耗，更能让图像清晰呈现！下面，一起来深入探究看它如何实现！ISP的作用与优势何为ISP？全称为Image Signal Processor（图像信号处理器），其主要作用是处理前端图像传感器输出的信号，主要功能有…

什么是受管文件传输（MFT）？对企业有何价值和作用？

一、什么是受管文件传输（MFT）？受管文件传输（Managed File Transfer, MFT），也可以称为“托管文件传输”，是一种专门用于安全、可靠地传输文件的解决方案。与传统的文件传输方式（如电子邮件、FTP）相比，MFT提供了更高的安全性、可管理性和自动化能力，能够满足企业对数…

FreeSWITCH 异常重启后会话快速恢复

FreeSWITCH 异常重启后会话快速恢复配置会话追踪sip_profiles/*.xml<param name="track-calls" value="true"/>（官方文档描述会有轻微性能影响）存储恢复数据、修改数据库位置重要 fs默认使用sqlite进行恢复数据的存储，也可以正常使用，但此处…