华为云数据库GaussDB(for Cassandra)揭秘：内存异常增长的排查经-电子发烧友网

内存异常增长的排查经历

背景介绍

华为云数据库GaussDB(for Cassandra)是一款基于计算存储分离架构，兼容Cassandra生态的云原生NoSQL数据库；它依靠共享存储池实现了强一致，保证数据的安全可靠。核心特点是：存算分离、低成本、高性能。

问题描述

GaussDB(for Cassandra)自研架构下遇到一些挑战性问题，比如cpu过高，内存泄漏，内存异常增长，时延高等问题，这些也都是开发过程中遇到的典型问题。分析内存异常增长是一个比较大的挑战，内存的异常增长对于程序来说是一个致命的问题，因为其可能触发OOM，进程异常宕机，业务中断等结果，所以对内存进行合理的规划使用及控制就显得尤为重要。通过调整cache容量，bloom过滤器大小，以及memtable大小等等，实现性能提升，读写时延改善等效果。

在线下测试过程中发现内核在长时间运行后，内存只增不减，出现异常增长的情况，怀疑可能存在内存泄漏。

分析&验证

首先根据内存使用，将内存分为堆内和堆外两个部分，分别进行该两块内存的分析。确定有问题的内存是堆外内存，进一步对堆外内存分析。引入更高效的内存管理工具tcmalloc，解决内存异常增长问题。下面为具体分析验证过程。

确定内存异常区域

使用jdk的jmap命令和Cassandra的监控(配置jvm.memory.*监控项)等方法，每隔1min采集jvm的堆内内存及进程整体内存。

启动测试用例，直到内核的整体内存达到上限。分析采集到的堆内内存和进程内存变化曲线，发现其堆内内存仍保持相对稳定，未出现一直持续上涨，但期间内核的整体内存仍然在持续上涨，两者的增长曲线不符。即问题应该发生在堆外内存。

堆外内存分析验证

glibc内存管理

使用pmap命令打印进程的内存地址空间分布，发现有大量的64MB的内存块和许多内存碎片，该现象与glibc的内存分配方式有关。堆外内存的使用和进程整体的内存增长趋势相近，初步怀疑该问题是由堆外内存导致。加之glibc归还内存的条件苛刻，即内存不易及时释放，内存碎片多，猜测问题和gblic有关系。当内存碎片过多，空闲内存浪费严重，最终进程内存的最大使用量会出现超过预期计划最大值的可能，甚至出现OOM。

tcmalloc内存管理

引入tcmalloc内存管理器，代替glibc的ptmalloc内存管理方式。减少过多的内存碎片，提高内存使用效率，本次分析验证采用gperftools-2.7源码进行tcmalloc的编译。运行相同的测试用例，发现内存仍在持续上涨，但是上涨幅度较之前降低，通过pmap打印出该内存地址分布情况，发现之前的小内存块和内存碎片显著减小，说明该工具有一定优化效果，印证了前面提到内存碎片过多的猜测。

但是内存异常增长的问题仍然存在，有点像是tcmalloc的回收不及时或者不回收导致。实际上tcmalloc的内存回收是比较"reluctant"的，主要是为了当再次需要内存申请时可以直接使用，减少系统调用次数，提高性能。基于此原因，下来进行手动调用其释放内存接口releasefreememory。发现效果不明显，原因暂时未知(可能确实存在没待释放的空闲内存)。

手动触发tcmalloc的releasefreememory接口

为验证该问题，通过设置cache容量的方式进行。

1.先设置cache的容量为6GB，然后将读请求压起来，使cache的6GB容量填满

2.修改cache的容量为2GB，为快速是内存释放，手动调用tcmalloc的releasefreememory接口，发现没有效果，推测采用tcmalloc之后，内存仍然一直上涨不下跌的原因可能与该接口的有关。

3.在releasefreememory接口内部的多个地方记录日志，然后启动进程再次测试，发现一处报错是在进行系统调用madvise时有出现失败。

代码位置：

报错日志信息：

1.通过该处的调用失败，分析代码。发现tcmalloc的内存释放逻辑是“round-robin”，即中间有一个span释放失败，则后续待释放的span被终止，releasefreememory逻辑调用结束。这个就和前面的现象吻合，执行完releasefreememory接口后基本没有效果，发现每次都是在释放了几十MB时，因为该接口的调用失败导致释放逻辑终止。

2.再次分析该系统调用madvise失败原因。通过给内核的该方法打patch，发现其失败原因是因为传入的地址块对应的内存状态是LOCKED状态。导致系统调用失败，报错为非法参数。

3.内存为LOCKED状态，和该状态相关的有代码调用mlock系统方法、系统的ulimit配置。分析相关代码未发现异常点。查询系统ulimit配置，发现max locked memory为unlimited。修改其配置为16MB，重启Cassandra进程，再次测试，发现内存释放效果显著。

4.继续运行测试，发现内存持续上涨的情况消失。在业务持续存在的情况下，内存会上涨到最高，不再上涨，保持平稳，符合内存计划使用量。业务压力减少甚至停止后，内存出现缓慢下降趋势。

解决&总结

1.引入tcmalloc工具，优化内存管理。比较优秀的内存管理器有Google的tcmalloc和Facebook的jemalloc等

2.修改系统的max locked memory参数配置。

合理分配进程需要使用内存的最大值，并预留一定容量，对于不符合预期增长的内存需要进一步分析。内存相关问题和程序相关性较强。系统的关键配置需谨慎，要评估其影响。同时排查了类似的所有配置。

增加releasefreememory的命令，后端进行调用，优化tcmalloc hold内存不释放问题。不过releasefreememory命令的执行会锁整个pageHeap，可能导致内存分配请求被hang，所以需要小心执行。

后端增加可动态配置tcmalloc_release_rate的参数，来调整tcmalloc将内存交还给操作系统的频率。该值的合理范围是[0-10]，0表示永远不交还，值越大，表示交还的频率越高，默认值是1。

结语

本文通过分析开发过程中遇到的内存增长问题，使用更优秀的内存管理工具，以及更细粒度的内存监控，更直观的监控数据库运行期间的内存状态，确保数据库平稳高性能运行。

审核编辑：汤梓红

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

数据库

数据库

+关注

关注
7

文章
3859

浏览量
64822
华为云

华为云

+关注

关注
3

文章
2706

浏览量
17657

华为云GaussDB助力统计现代化改革

2023年8月至2024年5月，华为云GaussDB助力国家统计局顺利完成第五次全国经济普查（简称“五经普”）单位清查和普查登记数据采集处理

发表于 02-12 10:59 •204次阅读

分布式云化数据库有哪些类型

分布式云化数据库有哪些类型？分布式云化数据库主要类型包括：关系型分布式数据库、非关系型分布式数据库

发表于 01-15 09:43 •140次阅读

构建数据库解决方案，基于华为云 Flexus X 实例容器化 MySQL 主从同步架构

华为云企业上云节，Flexus X 实例特惠开启，助力企业轻松构建高性能数据库系统。专业团队技术支持，确保部署无忧，运维高效。选择华为

发表于 01-07 17:22 •225次阅读

云数据库是哪种数据库类型？

云数据库是一种部署在虚拟计算环境中的数据库，它融合了云计算的弹性和可扩展性，为用户提供高效、灵活的数据库服务。

发表于 01-07 10:22 •173次阅读

华为云荣登Gartner®云数据库挑战者象限

近日，全球知名的信息技术研究与顾问公司Gartner®正式发布了其备受瞩目的2024年度《云数据库管理系统魔力象限报告》。在这份权威报告中，华为云凭借其卓越的表现成功入选挑战者象限，彰

发表于 12-31 13:57 •216次阅读

云数据库和云主机哪个好一点？

云数据库和云主机哪个好一点？云主机和云数据库各有优势，选择哪个更好取决于具体需求。

发表于 12-04 13:50 •198次阅读

数据库数据恢复—通过拼接数据库碎片恢复SQLserver数据库

一个运行在存储上的SQLServer数据库，有1000多个文件，大小几十TB。数据库每10天生成一个NDF文件，每个NDF几百GB大小。数据库包含两个LDF文件。存储损坏，数据库不

发表于 10-31 13:21 •369次阅读

云数据库可以租用吗？完整租用流程来了

云数据库是可以租用的，这是一种合法且便捷的数据存储和管理方式。云数据库是云服务提供商提供的各种服

发表于 10-28 09:54 •231次阅读

科技云报到：大模型时代下，向量数据库的野望

科技云报到：大模型时代下，向量数据库的野望

发表于 10-14 17:18 •322次阅读

Oracle数据恢复—异常断电后Oracle数据库启库报错的数据恢复案例

Oracle数据库故障：机房异常断电后，Oracle数据库启库报错：“system01.dbf需要更多的恢复来保持一致性，数据库无法打开

发表于 09-30 13:31 •420次阅读

恒讯科技分析：云数据库rds和redis区别是什么如何选择？

云数据库RDS（Relational Database Service）和Redis是两种不同类型的数据库服务，它们有各自的特点和适用场景： 1、数据模型：RDS是一种关系型

发表于 08-19 15:31 •492次阅读

华为云GaussDB数据库基础版发布：旗舰性能、价格下降超60%

高性价比：相比企业版，华为云 GaussDB 基础版价格大幅下调（降幅达 60%-70%），且支持全场景数据压缩，具有“超高压缩比”，性能影响仅为 5%-10%，存储成本降低 50%。

发表于 05-07 14:21 •734次阅读

华为云多模数据库 GeminiDB 架构与应用实践直播问答实录

多模数据库作为一种新兴的数据管理解决方案，正在受到越来越多的关注。而华为云多模数据库 GeminiDB 基于云原生

发表于 04-08 18:25 •1233次阅读

选择 KV 数据库最重要的是什么？

经常有客户提到 KV 数据库，但却偏偏“不要 Redis”。比如有个做安全威胁分析平台的客户，他们明确表示自己对可靠性要求非常高，需要的不是开源 Redis 这种内存缓存库，而是 KV 数据库

发表于 03-28 22:11 •763次阅读

GaussDB(for Redis) 特性揭秘：多租户管理

华为云 GaussDB(for Redis)持续完善企业级增强特性，是名副其实的 "Redis Plus" ，其中很经典的企业级特性是多租户能力，支持添加只读账号、读写账号，且具备强大的 DB

发表于 03-28 22:06 •811次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

华为云数据库GaussDB(for Cassandra)揭秘：内存异常增长的排查经

评论

华为云GaussDB助力统计现代化改革

分布式云化数据库有哪些类型

构建数据库解决方案，基于华为云 Flexus X 实例容器化 MySQL 主从同步架构

云数据库是哪种数据库类型？

华为云荣登Gartner®云数据库挑战者象限

云数据库和云主机哪个好一点？

数据库数据恢复—通过拼接数据库碎片恢复SQLserver数据库

云数据库可以租用吗？完整租用流程来了

科技云报到：大模型时代下，向量数据库的野望

Oracle数据恢复—异常断电后Oracle数据库启库报错的数据恢复案例

恒讯科技分析：云数据库rds和redis区别是什么如何选择？

华为云GaussDB数据库基础版发布：旗舰性能、价格下降超60%

华为云多模数据库 GeminiDB 架构与应用实践直播问答实录

选择 KV 数据库最重要的是什么？

GaussDB(for Redis) 特性揭秘：多租户管理