缓存使用中常见问题和解决方案-电子发烧友网

原始数据存储在 DB 中（如 MySQL、Hbase 等），但 DB 的读写性能低、延迟高。

比如 MySQL 在 4 核 8G 上的 TPS = 5000，QPS = 10000 左右，读写平均耗时 10~100 ms。

用 Redis 作为缓存系统正好可以弥补 DB 的不足，「码哥」在自己的 MacBook Pro 2019 上执行 Redis 性能测试如下：

$redis-benchmark-tset,get-n100000-q
SET:107758.62requestspersecond,p50=0.239msec
GET:108813.92requestspersecond,p50=0.239msec

TPS 和 QPS 达到 10 万，于是乎我们就引入缓存架构，在数据库中存储原始数据，同时在缓存总存储一份。

当请求进来的时候，先从缓存中取数据，如果有则直接返回缓存中的数据。

如果缓存中没数据，就去数据库中读取数据并写到缓存中，再返回结果。

这样就天衣无缝了么？缓存的设计不当，将会导致严重后果，本文将介绍缓存使用中常见的三个问题和解决方案：

缓存击穿（失效）；

缓存穿透；

缓存雪崩。

缓存击穿（失效）

高并发流量，访问的这个数据是热点数据，请求的数据在 DB 中存在，但是 Redis 存的那一份已经过期，后端需要从 DB 从加载数据并写到 Redis。

关键字：单一热点数据、高并发、数据失效

但是由于高并发，可能会把 DB 压垮，导致服务不可用。如下图所示：

缓存击穿

解决方案

过期时间 + 随机值

对于热点数据，我们不设置过期时间，这样就可以把请求都放在缓存中处理，充分把 Redis 高吞吐量性能利用起来。

或者过期时间再加一个随机值。

设计缓存的过期时间时，使用公式：过期时间=baes 时间+随机时间。

即相同业务数据写缓存时，在基础过期时间之上，再加一个随机的过期时间，让数据在未来一段时间内慢慢过期，避免瞬时全部过期，对 DB 造成过大压力

预热

预先把热门数据提前存入 Redis 中，并设热门数据的过期时间超大值。

使用锁

当发现缓存失效的时候，不是立即从数据库加载数据。

而是先获取分布式锁，获取锁成功才执行数据库查询和写数据到缓存的操作，获取锁失败，则说明当前有线程在执行数据库查询操作，当前线程睡眠一段时间在重试。

这样只让一个请求去数据库读取数据。

伪代码如下：

publicObjectgetData(Stringid){
Stringdesc=redis.get(id);
//缓存为空，过期了
if(desc==null){
//互斥锁，只有一个请求可以成功
if(redis(lockName)){
try
//从数据库取出数据
desc=getFromDB(id);
//写到Redis
redis.set(id,desc,60*60*24);
}catch(Exceptionex){
LogHelper.error(ex);
}finally{
//确保最后删除，释放锁
redis.del(lockName);
returndesc;
}
}else{
//否则睡眠200ms，接着获取锁
Thread.sleep(200);
returngetData(id);
}
}
}

缓存穿透

缓存穿透：意味着有特殊请求在查询一个不存在的数据，即数据不存在 Redis 也不存在于数据库。

导致每次请求都会穿透到数据库，缓存成了摆设，对数据库产生很大压力从而影响正常服务。

如图所示：

缓存穿透

解决方案

缓存空值：当请求的数据不存在 Redis 也不存在数据库的时候，设置一个缺省值（比如：None）。当后续再次进行查询则直接返回空值或者缺省值。

布隆过滤器：在数据写入数据库的同时将这个 ID 同步到到布隆过滤器中，当请求的 id 不存在布隆过滤器中则说明该请求查询的数据一定没有在数据库中保存，就不要去数据库查询了。

BloomFilter 要缓存全量的 key，这就要求全量的 key 数量不大，10 亿条数据以内最佳，因为 10 亿条数据大概要占用 1.2GB 的内存。

“

说下布隆过滤器的原理吧

”

BloomFilter 的算法是，首先分配一块内存空间做 bit 数组，数组的 bit 位初始值全部设为 0。

加入元素时，采用 k 个相互独立的 Hash 函数计算，然后将元素 Hash 映射的 K 个位置全部设置为 1。

检测 key 是否存在，仍然用这 k 个 Hash 函数计算出 k 个位置，如果位置全部为 1，则表明 key 存在，否则不存在。

如下图所示：

布隆过滤器

哈希函数会出现碰撞，所以布隆过滤器会存在误判。

这里的误判率是指，BloomFilter 判断某个 key 存在，但它实际不存在的概率，因为它存的是 key 的 Hash 值，而非 key 的值。

所以有概率存在这样的 key，它们内容不同，但多次 Hash 后的 Hash 值都相同。

对于 BloomFilter 判断不存在的 key ，则是 100% 不存在的，反证法，如果这个 key 存在，那它每次 Hash 后对应的 Hash 值位置肯定是 1，而不会是 0。布隆过滤器判断存在不一定真的存在。

缓存雪崩

缓存雪崩指的是大量的请求无法在 Redis 缓存系统中处理，请求全部打到数据库，导致数据库压力激增，甚至宕机。

出现该原因主要有两种：

大量热点数据同时过期，导致大量请求需要查询数据库并写到缓存；

Redis 故障宕机，缓存系统异常。

缓存大量数据同时过期

数据保存在缓存系统并设置了过期时间，但是由于在同时一刻，大量数据同时过期。

系统就把请求全部打到数据库获取数据，并发量大的话就会导致数据库压力激增。

缓存雪崩是发生在大量数据同时失效的场景，而缓存击穿（失效）是在某个热点数据失效的场景，这是他们最大的区别。

如下图：

缓存雪崩-大量缓存同时失效

解决方案

过期时间添加随机值

要避免给大量的数据设置一样的过期时间，过期时间 = baes 时间+ 随机时间（较小的随机数，比如随机增加 1~5 分钟）。

这样一来，就不会导致同一时刻热点数据全部失效，同时过期时间差别也不会太大，既保证了相近时间失效，又能满足业务需求。

接口限流

当访问的不是核心数据的时候，在查询的方法上加上接口限流保护。比如设置 10000 req/s。

如果访问的是核心数据接口，缓存不存在允许从数据库中查询并设置到缓存中。

这样的话，只有部分请求会发送到数据库，减少了压力。

限流，就是指，我们在业务系统的请求入口前端控制每秒进入系统的请求数，避免过多的请求被发送到数据库。

如下图所示：

缓存雪崩-限流

Redis 故障宕机

一个 Redis 实例能支撑 10 万的 QPS，而一个数据库实例只有 1000 QPS。

一旦 Redis 宕机，会导致大量请求打到数据库，从而发生缓存雪崩。

解决方案

对于缓存系统故障导致的缓存雪崩的解决方案有两种：

服务熔断和接口限流；

构建高可用缓存集群系统。

服务熔断和限流

在业务系统中，针对高并发的使用服务熔断来有损提供服务从而保证系统的可用性。

服务熔断就是当从缓存获取数据发现异常，则直接返回错误数据给前端，防止所有流量打到数据库导致宕机。

服务熔断和限流属于在发生了缓存雪崩，如何降低雪崩对数据库造成的影响的方案。

构建高可用的缓存集群

所以，缓存系统一定要构建一套 Redis 高可用集群，如果 Redis 的主节点故障宕机了，从节点还可以切换成为主节点，继续提供缓存服务，避免了由于缓存实例宕机而导致的缓存雪崩问题。

总结

缓存穿透指的是数据库本就没有这个数据，请求直奔数据库，缓存系统形同虚设。

缓存击穿（失效）指的是数据库有数据，缓存本应该也有数据，但是缓存过期了，Redis 这层流量防护屏障被击穿了，请求直奔数据库。

缓存雪崩指的是大量的热点数据无法在 Redis 缓存中处理（大面积热点数据缓存失效、Redis 宕机），流量全部打到数据库，导致数据库极大压力。

原文标题：Redis 缓存击穿（失效）、缓存穿透、缓存雪崩怎么解决？

文章出处：【微信公众号：数据分析与开发】欢迎添加关注！文章转载请注明出处。

审核编辑：彭菁

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

数据存储

数据存储

+关注

关注
5

文章
987

浏览量
51248
缓存

缓存

+关注

关注
1

文章
243

浏览量
26816
数据库

数据库

+关注

关注
7

文章
3866

浏览量
64940

原文标题：Redis 缓存击穿（失效）、缓存穿透、缓存雪崩怎么解决？

文章出处：【微信号：DBDevs，微信公众号：数据分析与开发】欢迎添加关注！文章转载请注明出处。

仪表放大器--常见的应用问题和解决方案

仪表放大器--常见的应用问题和解决方案很完整的资料！

发表于 12-15 09:53

石英晶振的常见问题以及解决方案

石英晶振的常见问题以及解决方案

发表于 03-21 21:17

电压开关中常见问题及解决方案

电压开关中常见问题及解决方案

发表于 05-23 10:05

protues仿真常见问题解决方案分享

protues仿真常见问题解决方案！来源：电子工程师成长日记

发表于 01-17 08:52

电动车用电池使用中常见问题及原因分析

电动车用电池使用中常见问题及原因分析

发表于 11-11 14:10 •896次阅读

电压开关中常见问题及解决方案

电压开关中常见问题及解决方案 设计自动化的测试系统开关需要搞清楚要开关信号和要执行测试的特点。例如，在测试应用中承受开关电压信号的

发表于 05-05 17:32 •1200次阅读

RF电路设计中常见问题及解决方案

RF电路设计中常见问题及解决方案

发表于 01-11 12:55 •32次下载

触摸感应软件库常见问题和解答

触摸感应软件库常见问题和解答

发表于 10-15 09:06 •2次下载

触摸感应软件库<b class='flag-5'>常见问题</b><b class='flag-5'>和解</b>答

labview有哪些常见问题？labview三个常见问题和解决方法概述

本文档的主要内容详细介绍的是labview有哪些常见问题？labview三个常见问题和解决方法概述三个常见问题是：1.labview在运行后关闭的时候出现重置vi。一直无法关闭，并且无

发表于 09-18 18:53 •0次下载

protues仿真常见问题解决方案

protues仿真常见问题解决方案！来源：电子工程师成长日记

发表于 01-17 10:33 •4次下载

Brocade存储扩展解决方案常见问题

电子发烧友网站提供《Brocade存储扩展解决方案常见问题.pdf》资料免费下载

发表于 08-29 11:22 •0次下载

Brocade存储扩展<b class='flag-5'>解决方案</b><b class='flag-5'>常见问题</b>

石英谐振器应用中常见问题及解决方案

石英谐振器应用中常见问题及解决方案 石英谐振器是一种广泛应用于电子设备中的振荡器。它通过石英晶体的谐振效应来提供稳定的频率信号。然而，在实际应用中，石英谐振器可能会遇到一些常见问题。本文将探讨一些

发表于 12-15 14:00 •632次阅读

PCB金手指设计的常见问题和解决方案

PCB金手指设计的常见问题和解决方案

发表于 12-25 10:09 •2848次阅读

soc开发流程常见问题及解决方案

SOC（System on a Chip，系统级芯片）开发流程中常见问题及解决方案主要包括以下几个方面：一、环境问题 常见问题 ：开发环境配置复杂，新手难以快速上手。依赖项缺失或版本不兼容

发表于 11-10 09:26 •910次阅读

电子设备EMC测试整改：常见问题与解决方案

深圳南柯电子｜电子设备EMC测试整改：常见问题与解决方案

发表于 12-23 11:47 •467次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

缓存使用中常见问题和解决方案

评论

仪表放大器--常见的应用问题和解决方案

石英晶振的常见问题以及解决方案

电压开关中常见问题及解决方案

protues仿真常见问题解决方案分享

电动车用电池使用中常见问题及原因分析

电压开关中常见问题及解决方案

RF电路设计中常见问题及解决方案

触摸感应软件库常见问题和解答

labview有哪些常见问题？labview三个常见问题和解决方法概述

protues仿真常见问题解决方案

Brocade存储扩展解决方案常见问题

石英谐振器应用中常见问题及解决方案

PCB金手指设计的常见问题和解决方案

soc开发流程常见问题及解决方案

电子设备EMC测试整改：常见问题与解决方案