0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

对比两个基于Redis下的存储方案在性能方面的优劣

冬至配饺子 来源:开发内功修炼 作者:张彦飞allen 2022-08-30 17:13 次阅读

现代的开发语言除了C++以外,大部分都对内存管理做好了封装,一般的开发者根本都接触不到内存的底层操作。更何况现在各种优秀的开源组件应用越来越多,例如mysql、redis等,这些甚至都不需要大家动手开发,直接拿来用就好了。所以有些同学也会觉得作为应用层开发的同学没有学习的必要去学习底层。

但我想通过本文的实际案例告诉大家,哪怕不直接接触内存底层操作,就只是用一些开源的工具,如果你能理解底层的工作原理,你也能够用到极致。

1 用于访问历史存储需求

假如现在有这样一个业务需求,用户每次刷新都需要获得要消费的新数据,但是不能和之前访问过的历史重复。你可以把它和你经常在用的今日头条之类的信息流app联系起来。每次都要看到新的新闻,但是你肯定不想看到过去已经看过的文章。这样在功能实现的时候,就必要保存用户的访问历史。当用户再来刷新的时候,首先得获取用户的历史记录,要保证推给用户的数据和之前的不重复。当推荐完成的时候,也需要把这次新推荐过的数据id记录到历史里。

为了适当降低实现复杂度,我们可以规定每个用户只要不和过去的一万条记录重复就可以了。这样每个用户最多只需要保存一万条历史id,如果存满了就把最早的历史记录挤掉。我们进一步具体化一下这个需求的几个关键点:

每个数据id是一个int整数来表示

每个用户要保存1万条id

每次用户刷新开始的时候需要将这1万条历史全部读取出来过滤一遍

每次用户刷新结束的时候需要将新访问过的10条写入一遍,如果超过1万需将最早的记录挤掉

可见,每次用户访问的时候,会涉及到一个1万规模的数据集上的一次读取和一次写入操作。好了,需求描述完了,我们怎么样进行我们的技术方案的设计呢?相信你也能想到很多实现方案,我们今天来对比两个基于Redis下的存储方案在性能方面的优劣。

2 Redis方案一:用list存储

首先能想到的第一个办法就是用Redis的List来保存。因为这个数据结构设计的太适合上面的场景了。List下的lrange命令可以实现一次性读取用户的所有数据id的需求。

$redis->lrange('TEST_KEY', 0,9999);

lpush命令可以实现新的数据id的写入,ltrim可以保证将用户的记录数量不超过1万条。

pYYBAGMN08uAUdOAAAAnX5dIbiQ827.png

我们准备一个用户,提前存好一万条id。写入的时候每次只写入10条新的id,读取的时候通过lrange一次全部读取出来。进行一下性能耗时测试,结果如下。

poYBAGMN09uAQwwVAAA8KE_cBD0711.png

3 Redis方案二:用string存储

我能想到的另外一个技术方案就是直接用String来存。我们可以把1万个int表示的数据id拼接成一个字符串,用一个特殊的字符把他们分割开。例如:"100000_100001_10002"这种。存储的时候,拼接一下,然后把这个大字符串写到Redis里。读取的时候,把大字符串整体读取出来,然后再用字符切割成数组来使用。

由于用string存储的时候,保存前多了一个拼接字符串的操作,读取后多了一步将字符串分割成数组的操作。在测试string方案的时候,为了公平起见,我们把需要把这两步的开销也考虑进来。核心代码如下:

poYBAGMN0_CAWg8LAABH9kH-xPI569.png

耗时测试结果如下

pYYBAGMN0_aACu3kAAAvCYE15Dw687.png

4 结论

我们再直观对比下两个技术方案的性能数据。

pYYBAGMN1AyAZMp0AAA3xaNNfdE101.png

基于list的方案里,写入速度非常快,只需要0.066ms,因为仅仅只需要写入新添加的10条记录就可以了,再加一次链表的截断操作,但是读取性能可就要慢很多了,超过了4ms。原因之一是因为读取需要整体遍历,但其实还有第二个原因。我们本案例中的数据量过大,所以Redis在内部实际上是用双端链表来实现的。

pYYBAGMN1B-ANd5bAABpFFSQs0I221.png

通过上图你可能看出来,链表是通过指针串起来的。大量的node之间极大可能是随机地分布在内存的各个位置上,这样你遍历整个链表的时候,实际上大概率会导致内存的随机模式下工作。

基于string方案在写入的时候耗时比list要高,因为每次都得需要将1万条全部写入一遍。但是读取性能却比list高了10倍,总体上耗时加起来大约只有方案一的1/4左右。为什么?我们再来看下redis string数据结构的内存布局

poYBAGMN1EGATahpAABZyrvxW70481.png

可见,如果用string来存储的话,不管用户的数据id有多少,访问将全部都是顺序IO。顺序IO的好处有两点:

1. 一内存的顺序IO的耗时大约只是随机IO的1/3-1/4左右,

2. 对于读取来说,顺序访问将极大地提升CPU的L1、L2、L3的cache命中率

所以如果你深入了内存的工作原理,哪怕你不能直接去操作内存,即使只是用一些开源的软件,你也能够将它的性能发挥到极致~



审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储器
    +关注

    关注

    38

    文章

    7507

    浏览量

    163962
  • 字符串
    +关注

    关注

    1

    文章

    579

    浏览量

    20549
  • Redis
    +关注

    关注

    0

    文章

    376

    浏览量

    10887
收藏 人收藏

    评论

    相关推荐

    华为云Flexus X实例,Redis性能加速评测及对比

    加速 Redis 的选项。本文旨在通过实际测试,展示华为云 Flexus X 实例加速 Redis 方面的性能优势,并与其他业界 U1 实
    的头像 发表于 12-29 15:47 169次阅读
    华为云Flexus X实例,<b class='flag-5'>Redis</b><b class='flag-5'>性能</b>加速评测及<b class='flag-5'>对比</b>

    Redis使用重要的两个机制:Reids持久化和主从复制

    今天这篇文章,我们一起了解 Redis 使用中非常重要的两个机制:Reids 持久化和主从复制。 我们都知道Redis是一内存数据库,在学习主从同步之前,我们首先要想到
    的头像 发表于 12-18 10:33 127次阅读
    <b class='flag-5'>Redis</b>使用重要的<b class='flag-5'>两个</b>机制:Reids持久化和主从复制

    Redis缓存与Memcached的比较

    关键特性和差异: 1. 数据存储 Redis: Redis是一开源的键值存储,支持多种数据结构,如字符串、列表、集合、有序集合、散列、位图
    的头像 发表于 12-18 09:33 165次阅读

    ad如何设置两个元器件的距离

    Altium Designer(简称AD)中设置两个元器件之间的距离,主要是通过设置元器件间的安全间距(Clearance)规则来实现的。这个规则定义了元器件之间、元器件与走线之间以及其他设计元素
    的头像 发表于 09-02 15:31 7495次阅读

    使用ADS8691有两个参数方面的疑问求解

    你好,我现在在使用ADS8691,现在有两个参数方面的疑问。 第一是转换时间,如图所示 CS从拉低开始转换,到RVS跳变为高电平表示转换完成的时间有1.6us,远远大于手册里所说的665ns
    发表于 08-19 08:27

    双稳态电路的两个稳定状态是什么

    双稳态电路是一种具有两个稳定状态的电子电路,广泛应用于数字电路、通信系统、存储器等领域。 双稳态电路的基本概念 双稳态电路是一种具有两个稳定状态的电路,即在没有外部输入信号的情况,电
    的头像 发表于 08-11 15:00 1537次阅读

    双稳态触发器的两个基本性质是什么

    的定义 双稳态触发器是一种具有两个稳定状态的逻辑电路,通常由两个交叉耦合的反相器或门电路构成。没有外部输入信号的情况,双稳态触发器可以保持
    的头像 发表于 08-11 10:08 732次阅读

    可以单个esp8266上安装两个NON OS SDK应用程序吗?

    ,因为整个解决方案可能很复杂。 我可以想象我会在闪光灯中出现两个 iroms。此外,我相信第一应用程序的 iram 部分位于 FLASH 的开头,并在启动后被复制。 我不确定的是,我怎样才能设法将第二
    发表于 07-19 07:28

    红外热成像与微光夜视优劣对比

    现代科技发展的驱动,人类已经不再对夜晚和低光环境无能为力。尤其是夜视安全等领域,夜视技术的应用尤为重要。其中,红外热成像和微光夜视是种最主要的夜视技术。这
    的头像 发表于 07-03 16:05 590次阅读
    红外热成像与微光夜视<b class='flag-5'>优劣</b>势<b class='flag-5'>对比</b>

    大数据军事方面的应用有哪些

    智慧华盛恒辉大数据军事方面的应用涵盖了多个方面,这些应用不仅提高了军事管理的效率和水平,也极大地提升了军队的作战能力和情报获取能力。以下是大数据军事
    的头像 发表于 06-23 10:34 1057次阅读

    GEN5 NVME硬盘RAID的性能比较

    解决方案包含两个核心元素:GPU 和软件定义存储 (SDS) 堆栈。 与 RAID 卡一样,GPU 将大部分硬盘管理和数据保护任务从 CPU 中分离出来,从
    发表于 05-27 17:41 1447次阅读
    <b class='flag-5'>在</b>GEN5 NVME硬盘<b class='flag-5'>下</b>RAID的<b class='flag-5'>性能</b>比较

    Redis为什么这么快?

    Redis 是基于内存的数据库,那不可避免的就要与磁盘数据库做对比。对于磁盘数据库来说,是需要将数据读取到内存里的,这个过程会受到磁盘 I/O 的限制。而对于内存数据库来说,本身数据就存在于内存里,也就没有了这方面的开销。
    发表于 04-12 10:32 220次阅读
    <b class='flag-5'>Redis</b>为什么这么快?

    GaussDB(for Redis) 特性揭秘:多租户管理

    级鉴权能力,即可约束每个账号可访问的数据库(DB)范围,避免误操作其他租户数据。该特性可以帮助企业共享 Redis 实例的情况,保护不同租户的数据安全,为企业的开发和管理提供便利。 哪些用户需要使用多租户功能? 多租户是数
    的头像 发表于 03-28 22:06 755次阅读
    GaussDB(for <b class='flag-5'>Redis</b>) 特性揭秘:多租户管理

    fpga通信方面的应用

    FPGA通信方面的应用非常广泛,以下是一些主要的应用场景。
    的头像 发表于 03-27 14:10 1142次阅读

    arcgis中如何关联两个属性表

    ArcGIS中,关联两个属性表是一重要的操作,可以通过此操作将两个表中的数据关联起来,以便进行分析和查询。下面是详细介绍如何在ArcGIS中实现属性表的关联。 首先,我们需要明确
    的头像 发表于 02-25 11:01 4304次阅读