缓存系统的三座大山-电子发烧友网

1.无处不在的缓存

缓存在计算机系统是无处不在，在CPU层面有L1-L3的Cache，在Linux中有TLB加速虚拟地址和物理地址的转换，在浏览器有本地缓存、手机有本地缓存等。

可见，缓存在计算机系统中有非常重要的地位，其主要作用是提高响应速度、减少磁盘访问等，本文主要讨论在高并发系统中的缓存系统。

一句话概括缓存系统在高并发系统中的地位的话：如果高并发系统是烤羊肉串，那么缓存系统就是那一撮孜然。

2.高并发系统中的缓存

2.1 缓存系统的作用

缓存系统在高并发系统的作用很大，在某种程度上可以说没有缓存系统很难支撑高并发场景。

基于机械磁盘或SSD的数据库系统，一般来说读写的速度远慢于内存，因此单纯磁盘介质的数据库无法支撑很高的并发，可以简单认为缓存是保护磁盘数据库的重要屏障。

对于一些基于LSM的存储引擎数据库来说，随机写改为顺序写速度提升很大，但是随机读仍然是个问题，所以缓存系统是很有必要的。

2.2 缓存系统访问流程

实际场景也是读多写少，看看请求是如何得到响应的，简单看下交互流程：

请求到达之后，业务线程首先访问缓存，如果缓存命中则返回

如果未命中则继续请求磁盘数据库系统，获取数据返回

从磁盘获取数据后将结果回写到缓存系统且增加老化时间，为下次请求做准备

以上是高并发系统中缓存和磁盘数据库系统、客户端请求之间的交互过程，后续的问题分析，也是基于此过程展开的。

3.缓存系统的三大问题

网络上对于缓存三大问题的文章很多，提到的三个问题主要是：

缓存雪崩 Cache Avalanche

缓存穿透 Cache Penetration

缓存击穿 Hotspot Invalid

对于上面的三个名词我一直分不清楚，脑海中并没有清晰的区别。

于是想到去谷歌看看歪果仁是怎么说的，然而英文表述就是上面的英文，基本上和汉语翻译是一样的，所以只能强记，太难了。

3.1 缓存雪崩问题

所谓雪崩就是原来有所支撑的冰雪，某一瞬间失去依托，瞬间涌下来。

这个场景让我想起了2011年上映的柯南剧场版《沉默的十五分钟》，柯南在北泽村水库为了拯救村庄制造的雪崩：

可见雪崩确实很可怕，回到高并发系统，如果缓存系统故障，大量的请求无法从缓存完成数据请求，就全量汹涌冲向磁盘数据库系统，导致数据库被打死，整个系统彻底崩溃。

3.2 缓存雪崩解决方案

造成缓存雪崩的主要原因是缓存系统不够高可用，因此提高缓存系统的稳定性和可用性十分必要，比如对于使用Redis作为缓存的系统而言可以使用哨兵机制、集群化、持久化等来提高缓存系统的HA。

除了保证缓存系统的HA之外，服务本身也需要支持降级，可以借助比如Hystrix来实现服务的熔断、降级、限流来降低出现雪崩时的故障程度。

说白了就是别让服务彻底死掉就行，就像大雪封高速肯定不能通行了，堵车慢一些至少可以走。

3.3 缓存穿透问题

穿透形象一点就是：请求过来了转了一圈一无所获就像穿过透明地带一样。

在高并发系统中缓存穿透，如果一个req需要请求的数据在缓存中没有，这时业务线程就会访问磁盘数据库系统，然而磁盘数据库也没有这个数据，无奈业务线程只能白白处理一圈。

如果某时段有大量恶意的不存在的key的集中请求，那么服务将一直处理这些根本不存在的请求，导致正常请求无法被处理，从而出现问题。

举个栗子：

拉面馆的服务员和厨师不允许拒绝已经进来的消费者，但是拉面馆的经营范围有限。此时恶意消费者点了一只5斤的澳洲龙虾，经过服务员和厨师都无法响应这个需求，此时轮流来了1000个这样的恶意消费者，拉面馆基本要歇菜了。

3.4 缓存穿透解决方案

有效甄别是否存在这个key再决定是否读取很重要，常见的做法有：

把不存在的key写一下null，这样再来就相当于命中了，其实这种方法局限性很大，今天是5斤龙虾，明天改成6斤的螃蟹，缓存系统和数据库中存储大量无用key本身是无意义的，所以一般不建议

另外一种思路，转换为查找问题，类似于在海量数据中查找某个key是否存在，考虑空间复杂度和时间复杂度，一般选用布隆过滤器来实现。

布隆过滤器是个好东西，有非常多的用途，包括：垃圾邮件识别、搜索蜘蛛爬虫url去重等，主要借助K个哈希函数和一个超大的bit数组来降低哈希冲突本身带来的误判，从而提高识别准确性。

布隆过滤器也存在一定的误判，假如判断存在可能不一定存在，但是假如判断不存在就一定不存在，因此刚好用在解决缓存穿透的key查找场景，事实上很多系统都是基于布隆过滤器来解决缓存穿透问题的。

3.5 缓存击穿问题

缓存击穿是这样一种情况：

由于缓存系统中的热点数据都有过期时间，如果没有过期时间就造成了主存和缓存的数据不一致，因此过期时间一般都不会太长。

设想某时刻一批热点数据同时在缓存系统中过期失效，那么这部分数据就都将请求磁盘数据库系统。

从描述上来看有点像微小规模的雪崩，但是对数据库的压力就很小了，只不过会影响并发性能，然而在多线程场景中缓存击穿却是经常发生的，相反缓存穿透和雪崩频率不如缓存击穿，因此研究击穿的现实意义更大一些。

3.6 缓存击穿解决方案

可以采用的方案大概有几种：

在设置热点数据过期时间时尽量分散，比如设置100ms的基础值，在此基础上正负浮动10ms，从而降低相同时刻出现CacheMiss的key的数量。

另外一种做法是多线程加锁，其中第一个线程发现CacheMiss之后进行加锁，再从数据库获取内容之后写到缓存中，其他线程获取锁失败则阻塞数ms之后再进行缓存读取，这样可以降低访问数据数据库的线程数，需要注意在单机和集群需要使用不同的锁，集群环境使用分布式锁来实现，但是由于锁的存在也会影响并发效率。

一种方法是在业务层对使用的热点数据查看是否即将过期，如果即将过期则去数据库获取最新数据进行更新并延长该热点key在缓存系统中的时间，从而避免后面的过期CacheMiss，相当于把事情提前解决了。

缓存击穿的解决方法都有一定的权衡，实际中根据自己的需求来解决。

缓存击穿的影响一般来说并不会太大，或许在你的服务跑了很久之后你才意识到会有缓存击穿问题。

4.小结

缓存系统无论在实际工作中还是在面试中都是热点内容，缓存系统目的是为了让访问又准又快，不要一味追求缓存命中率，缓存和主数据库的数据一致性是需要重点考虑的。

总起来说，如何在保证数据正确性的前提下提高缓存命中率就是核心问题。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

cpu

cpu

+关注

关注
68

文章
10856

浏览量
211628
Linux

Linux

+关注

关注
87

文章
11297

浏览量
209370
缓存

缓存

+关注

关注
1

文章
239

浏览量
26674

原文标题：什么是缓存系统三座大山

文章出处：【微信号：LinuxHub，微信公众号：Linux爱好者】欢迎添加关注！文章转载请注明出处。

HTTP缓存头的使用本地缓存与远程缓存的区别

HTTP缓存头是一组HTTP响应头，它们控制浏览器和中间代理服务器如何缓存网页内容。合理使用HTTP缓存头可以显著提高网站的加载速度和性能，减少服务器的负载。 1. HTTP缓存头概述

发表于 12-18 09:41 •94次阅读

甲骨文规划三座小型核电站赋能AI数据中心

甲骨文公司近日宣布了一项重大能源战略，已获得授权建设三座小型模块化核反应堆，旨在为旗下庞大的AI数据中心提供清洁、稳定的电力支持。这一创新举措由公司董事长拉里·埃里森亲自披露，彰显了甲骨文在可持续发展与AI技术融合方面的前瞻视野。

发表于 09-19 18:18 •614次阅读

什么是CPU缓存？它有哪些作用？

CPU缓存（Cache Memory）是计算机系统中一个至关重要的组成部分，它位于CPU与内存之间，作为两者之间的临时存储器。CPU缓存的主要作用是减少CPU访问内存所需的时间，从而提高系统

发表于 08-22 14:54 •2935次阅读

基于望获实时Linux和飞腾E2000Q CPU的全国产工控解决方案

随着智能制造和工业4.0浪潮的席卷，工业生产对控制系统提出了前所未有的挑战——高精度、高实时性和高可靠性的需求如同三座大山，横亘在行业发展之路上。然而，环顾当前市场，高性能的国产化工业控制解决方案仍

发表于 08-08 13:48 •632次阅读

今日看点丨AI将带动今年全球服务器GPU产值破千亿美元；三星旗下Semes成功开发ArF-i光刻涂胶/显影设备

1. 台积高雄第三座2 纳米厂来了台积电高雄第一座2纳米厂施工中，第二座2纳米厂也已启动，第三座高雄P3厂用地17.22公顷，24日通过高雄市都市计划委员会变更为甲种工业区，未来

发表于 06-26 11:03 •576次阅读

台积电高雄P3厂用地变更获批，迈向第三座2nm厂建设

近日，台积电在高雄市的P3厂项目取得了重要进展。据可靠消息，6月24日，台积电高雄P3厂通过了高雄市都市计划委员会的用地变更申请，该地块将被正式变更为甲种工业区。这一里程碑式的进展意味着，台积电距离其第三座2nm厂的建设动工又近了一步。

发表于 06-26 10:21 •1365次阅读

天合光能供货的巴西三座光伏电站（Solar Park）成功并网运行

近日，由天合光能供货的巴西三座光伏电站（Solar Park）成功并网运行。这三座电站均位于巴西南部的巴拉那州，全部采用天合光能至尊N型720W系列组件和至尊670W组件，总装机量达21MW，为这座热情之都输入更多绿色能量。

发表于 05-14 10:32 •493次阅读

台积电将在美国凤凰城建设第三座芯片工厂

立第三座芯片工厂，将其在亚利桑那州的总投资增加至 650 亿美元。第三座晶圆厂将使用 2nm 或更先进的工艺生产芯片，并于本世纪末开始生产。美国总统拜登表示，这些设施将生产世界上最先进的芯片，促使美国有望在2030 年生产出全球 20% 的尖端半导体。他表示，

发表于 04-10 16:19 •377次阅读

台积电将建第3座晶圆厂台积电5/3nm涨定

近日，全球半导体制造巨头台积电宣布将进一步扩大在美国的投资版图，计划在亚利桑那州增设第三座工厂。

发表于 04-09 15:03 •691次阅读

台积电拟在高雄增设两座1.4nm工厂

台积电已在高雄的楠梓产业园建立了三座2nm工厂。其中，首家工厂计划于今年底投入使用，初期的产量为每月3000片芯片，之后将逐步提高到3万片。而P2、P3厂将于明年第四季度启动生产。

发表于 04-01 09:38 •410次阅读

格力斥资百亿，打造全球第二座、亚洲首座全自动化合物芯片工厂

2023年6月，珠海市环保部发布公告证实，格力电子元器件增产项目已经通过审核。根据环评文件，该项目占地面积达到20万平方米，建设周期12个月。预计将建造三座新厂房，含一座制造六寸SiC芯片的生产线、一座进行晶圆封装测试的生产线，

发表于 03-10 09:27 •4139次阅读

印度批准三座半导体工厂投资，金额达1.26万亿卢比

达到2700亿卢比，预计日产能力可达4800万颗芯片。　　而第三座封装测试工厂则由CG Power与日本瑞萨电子、泰国Stars Microelectronics合作运营，预计每日封装测试能力

发表于 03-01 09:09 •502次阅读

MLCC龙头村田三座工厂继续停工

据报道，作为MLCC（多层陶瓷电容器）行业的领军企业，村田制作所于17日发布了关于旗下工厂受日本能登半岛地震影响的最新公告。在这次地震中，共有13座工厂受到了不同程度的影响。

发表于 01-19 14:39 •861次阅读

如何选择合适的本地缓存？

小编最近在使用系统的时候，发现尽管应用已经使用了 redis 缓存提高查询效率，但是仍然有进一步优化的空间，于是想到了比分布式缓存性能更好的本地缓存，因此对领域内常用的本地

发表于 01-18 11:19 •848次阅读

Redis缓存预热+缓存雪崩+缓存击穿+缓存穿透要点简析

缓存预热就是系统上线后，提前将相关的缓存数据直接加载到缓存系统。

发表于 12-25 09:41 •905次阅读

搜索历史

缓存系统的三座大山

评论

HTTP缓存头的使用本地缓存与远程缓存的区别

甲骨文规划三座小型核电站赋能AI数据中心

什么是CPU缓存？它有哪些作用？

基于望获实时Linux和飞腾E2000Q CPU的全国产工控解决方案

今日看点丨AI将带动今年全球服务器GPU产值破千亿美元；三星旗下Semes成功开发ArF-i光刻涂胶/显影设备

台积电高雄P3厂用地变更获批，迈向第三座2nm厂建设

天合光能供货的巴西三座光伏电站（Solar Park）成功并网运行

台积电将在美国凤凰城建设第三座芯片工厂

台积电将建第3座晶圆厂台积电5/3nm涨定

台积电拟在高雄增设两座1.4nm工厂

格力斥资百亿，打造全球第二座、亚洲首座全自动化合物芯片工厂

印度批准三座半导体工厂投资，金额达1.26万亿卢比

MLCC龙头村田三座工厂继续停工

如何选择合适的本地缓存？

Redis缓存预热+缓存雪崩+缓存击穿+缓存穿透要点简析