0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

华为云数据库GaussDB(for Cassandra)揭秘:高性能低成本是什么样的体验?

科技说i 来源:科技说i 作者:科技说i 2022-12-02 09:15 次阅读

在我们的日常理念中,追求性价比是最为常见的,但是你知道购买低配置还能享受高性能、低延时、超低价的数据库有哪些吗?今天我们就用数据说话,带你深入了解GaussDB(for Cassandra)挑战高性价比!

众所周知,有数据的地方就需要用数据库,GaussDB(for Cassandra)最擅长在物流、内容分发、视频直播等海量数据的场景中,这样才能发挥它的特长。

本次围绕GaussDB(for Cassandra)新推出的2U8G小规格做一组测试并与自建ECS+开源Cassandra 8U32G进行性能和成本上的对比,快来和我一探究竟吧。

客户端压测工具

测试工具 版本 参考地址
YCSB 0.15.0 https://github.com/brianfrankcooper/ycsb/tree/0.15.0/cassandra

数据模型

YCSB业务模型 业务负载 负载说明
workload-read-mostly 95% read, 5% update 读95%,更新5%
workload-read-write-combination 50% update, 50% read 更新50%,读50%
workload-mixed-operational-analytical 65% read, 25% update, 10% insert 读65%,更新25%,写10%
workload-insert-mostly 90% insert, 10% read 写90%,读10%

部署数据库

华为云购买GaussDB(for Cassandra)

本次对比测试,采用华为云GaussDB(for Cassandra)2U8G规格,部署3个节点,申请100GB存储空间。具体操作如下:

poYBAGOIrhSAHaBHAAA9nL5vsGE511.png

备注:GaussDB(for Cassandra)采用DFV共享存储方案,存储层已实现三副本,该申请存储空间为业务数据可使用的空间。

pYYBAGOIrh6Ae3InAAA8WJgWUOQ407.png

poYBAGOIriOAYvmhAABk7Nj9mmU098.png

确认规格/节点数/存储空间,约8分钟即可创建完成。

创建实例后,每个业务节点对应一个系统容器,挂载2个磁盘(20G/40G),作为操作系统盘和日志盘。

pYYBAGOIriuAT_GGAABb28ymw-I756.png

公有云ECS部署开源Cassandra

本次对比测试,开源Cassandra采用购买ECS,自行部署Cassandra开源软件场景,同样部署3个节点,每个ECS在申请60GB的系统盘/日志盘的基础上,再额外申请100GB数据盘,作为Cassandra数据存储使用。

公有云购买ECS虚拟机

选择8U32G ECS规格,60GB的系统盘/日志盘,100G数据盘。

poYBAGOIrjWARsieAABXwq7Qpb8233.png

安装与操作开源Cassandra

ECS创建好后,将开源Cassandra搭建到ECS上,具体操作步骤参考以下链接地址

操作步骤

创建表模型

创建keyspace:

create keyspace ycsb WITH REPLICATION = {'class' : 'SimpleStrategy', 'replication_factor': 3 };

进入keyspace:

use ycsb;

创建usertable:

create table usertable (

y_id varchar primary key,

field0 varchar,

field1 varchar,

field2 varchar,

field3 varchar,

field4 varchar,

field5 varchar,

field6 varchar,

field7 varchar,

field8 varchar,

field9 varchar);

数据准备阶段

nohup ./bin/ycsb load cassandra-cql -P workloads/workload-insert-mostly -threads $THREAD_COUNT -s > $LOG_FILE 2>&1 &

YCSB四种业务模型压测

YCSB业务模型 业务负载 压测语句
workload-read-mostly 95% read, 5% update nohup ./bin/ycsb load cassandra-cql -P workloads/workload-read-mostly -threads $THREAD_COUNT -s > $LOG_FILE 2>&1 &
workload-read-write-combination 50% update, 50% read nohup ./bin/ycsb load cassandra-cql -P workloads/workload-read-write-combination -threads $THREAD_COUNT -s > $LOG_FILE 2>&1 &
workload-mixed-operational-analytical 65% read, 25% update, 10% insert nohup ./bin/ycsb load cassandra-cql -P workloads/workload-mixed-operational-analytical -threads $THREAD_COUNT -s > $LOG_FILE 2>&1 &
workload-insert-mostly 90% insert, 10% read nohup ./bin/ycsb load cassandra-cql -P workloads/workload-insert-mostly-threads $THREAD_COUNT -s > $LOG_FILE 2>&1 &

YCSB四种业务模型测试结果

测试结果指标说明

OPS:每秒操作数

insert_Lat(us):每次insert操作平均时延(微秒)

insert95Lat(us):95%的insert操作在多少微秒内

insert99Lat(us):99%的insert操作在多少微秒内

update_Lat(us):每次update操作平均时延(微秒)

update95Lat(us):95% update操作的时延在多少微秒以内

update99Lat(us):99% update操作的时延在多少微秒以内

read_Lat(us):每次read操作的平均时延(微秒)

read95Lat(us):95% read操作的时延在多少微秒以内

read99Lat(us):99% read操作的时延在多少微秒以内

GaussDB(for Cassandra) 2U8G测试结果

业务负载 OPS insert_Lat(us) insert95Lat(us) insert99Lat(us) update_Lat(us) update95Lat(us) update99Lat(us) read_Lat (us) read95Lat (us) read99Lat(us)
95% read, 5% update 8053 / / / 1506 1581 1653 2031 2209 2675
50% update, 50% read 9640 / / / 1446 1521 1598 2242 2847 3345
65% read, 25% update, 10% insert 9598 1467 1526 1623 1438 1494 1584 2073 2597 3105
90% insert, 10% read 9825 1524 1553 2105 / / / 2487 3131 4407

自建ECS+开源Cassandra 8U32G测试结果

经测试,开源Cassandra自建8U32G与GaussDB(for Cassandra)使用GaussDB(for Cassandra) 2U8G性能上持平,具体测试结果如下:

业务负载 OPS insert_Lat(us) insert95Lat(us) insert99Lat(us) update_Lat(us) update95Lat(us) update99Lat(us) read_Lat(us) read95Lat(us) read99Lat(us)
95% read, 5% update 8045 / / / 1349 1395 1576 2014 2121 7327
50% update, 50% read 9895 / / / 1342 1379 1553 2379 2918 3325
65% read, 25% update, 10% insert 9616 1386 1422 1596 1354 1392 1572 2273 2689 3717
90% insert, 10% read 9017 1441 1406 2009 / / / 4620 4511 67775

扩容操作

扩容GaussDB(for Cassandra)实例

华为云GaussDB(for Cassandra)采用存算分离架构,在计算扩容和存储扩容方面,无需进行数据搬迁,可以做到秒级运维。

计算扩容

在实例管理界面,选中添加节点,进入如下页面,可以选择本次扩容计算的节点个数。本次扩容以1个2U8G节点为例,具体如下:

poYBAGOIrkGAWoD_AACLbXvFdy4259.png

存储扩容

在集群基本信息页面,点击磁盘扩容,即可对磁盘空间进行扩容。

扩容自建ECS+开源Cassandra

自建Cassandra在扩容计算和存储期间,需要自行购买ECS计算节点,以及对应超高IO存储。手工修改节点配置、新加集群以及搬迁数据等。

计算扩容

自建Cassandra扩容计算,如上述购买多1台ECS虚拟机,挂载磁盘为60GB的系统盘/日志盘。时间推算需要30分钟。

pYYBAGOIrmSANl_6AABZVXpzWIc015.png

存储扩容

自建Cassandra扩容存储,在原挂载数据盘的基础上进行扩容。以上述实例为例,3个节点每个ECS的数据盘从100GB扩展到200GB,一共扩容300GB(3*100GB)。

pYYBAGOIrmSANl_6AABZVXpzWIc015.png

开源存储磁盘扩容按32Mbps/s的迁移速度算每秒为12MB,每分钟处理0.703GB的数据,迁移100GB的数据需要约2小时(100/0.703=142.2分钟)。

总结

性价比对比

从性价比看,华为GaussDB(for Cassandra)在相同存储容量以及性能表现下,费用仅为开源自建Cassandra的63%,具体如下:

对比项 ECS+开源Cassandra GaussDB(for Cassandra)
规格 8U32G * 3节点 2U8G * 3节点
存储空间 100GB 100GB
每小时费用 ¥9.222 ¥5.62
包年费用 ¥33,588 ¥21,034
95% read, 5% update OPS 8045 8053
50% update, 50% read OPS 9895 9640
65% read, 25% update, 10% insert OPS 9616 9598
90% insert, 10% read OPS 9017 9825

相同的数据空间,华为云GaussDB(for Cassandra)仅需要开源Cassandra 1/3的存储价格,享有高性能及更多的运维能力加持,享受非比寻常的体验。

运维能力对比

以典型的计算扩容和存储扩容场景为例,分析扩容100G存储以及扩容1个计算节点场景,从费用/时长方面做出对比,可看出用华为云GaussDB(for Cassandra),在费用和操作时长方面均有优势,扩容时长方面更是秒级扩容,一眼可见华为云GaussDB(for Cassandra)高扩容能力,具体如下:

运维场景 维度 ECS+开源Cassandra 8U32G GaussDB(for Cassandra) 2U8G
存储扩容 包年费用 ¥3,000 ¥2,500
扩容时长 约2小时 10秒
计算扩容 包年费用 ¥10,196 ¥6,178
扩容时长 30分钟 8分钟

综上所述,用开源Cassandra 63%的价格,享受一样的性能,存储实现秒级扩容,享有更好的运维能力,使用更好的架构最大化的节省成本,华为云GaussDB(for Cassandra)值得你拥有。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据库
    +关注

    关注

    7

    文章

    3794

    浏览量

    64362
  • 开源
    +关注

    关注

    3

    文章

    3309

    浏览量

    42471
  • 华为云
    +关注

    关注

    3

    文章

    2445

    浏览量

    17410
收藏 人收藏

    评论

    相关推荐

    数据库主机哪个好一点?

    数据库主机哪个好一点?主机和数据库各有优势,选择哪个更好取决于具体需求。
    的头像 发表于 12-04 13:50 106次阅读

    数据库服务器哪个便宜一些?

    服务器的价格区间相对更广泛,因为用户可以根据实际需求选择不同配置和性能的服务器。而数据库的价格则更多地依赖于数据库类型和规格。在相同配置
    的头像 发表于 11-12 10:55 174次阅读

    数据库数据恢复—通过拼接数据库碎片恢复SQLserver数据库

    一个运行在存储上的SQLServer数据库,有1000多个文件,大小几十TB。数据库每10天生成一个NDF文件,每个NDF几百GB大小。数据库包含两个LDF文件。 存储损坏,数据库
    的头像 发表于 10-31 13:21 199次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—通过拼接<b class='flag-5'>数据库</b>碎片恢复SQLserver<b class='flag-5'>数据库</b>

    服务器还需要租用数据库吗?

    如果你的应用程序需要处理大量的数据,并且这些数据需要高效的查询和分析能力,那么租用专业的数据库服务可能是更好的选择。这些服务通常提供了更高的性能、更好的可扩展性和更强的
    的头像 发表于 10-31 10:50 94次阅读

    数据库可以租用吗?完整租用流程来了

    数据库是可以租用的,这是一种合法且便捷的数据存储和管理方式。数据库服务提供商提供的各种服
    的头像 发表于 10-28 09:54 160次阅读

    华为 RDS for MySQL 数据库助力秒音数智化转型,引领社交电商新风尚

    for MySQL 数据库提供的高性能、高可用性数据库解决方案,秒音科技不仅实现了运营效率的显著提升,更在用户的社交分享流畅度与直播购物体验的深度优化上取得了突破,引领整个行业向更加智能化、高效化的全新发展方向迈进。 秒音的相
    的头像 发表于 10-22 20:24 699次阅读

    科技报到:大模型时代下,向量数据库的野望

    科技报到:大模型时代下,向量数据库的野望
    的头像 发表于 10-14 17:18 246次阅读

    一文讲清什么是分布式数据库

    分布式数据库是一种先进的数据管理系统,它将传统的数据库技术与分布式计算、计算和大数据处理技
    的头像 发表于 10-14 10:06 218次阅读

    数据库价格贵吗?数据库租用价格表

    不同的服务提供商会提供多样化的数据库产品,以满足不同规模和类型的企业需求。这些产品通常包括基础型、标准型、高性能型等多个档次,每个档次的价格都会有所不同。
    的头像 发表于 10-10 11:12 202次阅读
    <b class='flag-5'>云</b><b class='flag-5'>数据库</b>价格贵吗?<b class='flag-5'>云</b><b class='flag-5'>数据库</b>租用价格表

    一文详解企业上数据库是干嘛的

    业上数据库是企业将其数据库系统从传统的本地数据中心迁移到由第三方服务提供商管理的远程服务器上的过程。这样做的目的通常是为了提高
    的头像 发表于 09-13 11:49 325次阅读

    华为GaussDB数据库基础版发布:旗舰性能、价格下降超60%

    高性价比:相比企业版,华为 GaussDB 基础版价格大幅下调(降幅达 60%-70%),且支持全场景数据压缩,具有“超高压缩比”,性能
    的头像 发表于 05-07 14:21 623次阅读

    华为多模数据库 GeminiDB 架构与应用实践直播问答实录

    多模数据库作为一种新兴的数据管理解决方案,正在受到越来越多的关注。而华为多模数据库 GeminiDB 基于云原生
    的头像 发表于 04-08 18:25 1158次阅读

    选择 KV 数据库最重要的是什么?

    最后我也没问清楚他们业务存啥(推测是这块业务数据比较机密),但确实业务本身对可靠性要求非常高,开源 Redis 自身的可靠性无法满足他们的要求,最终该用户选择使用 GaussDB(for Redis)数据库,当前
    的头像 发表于 03-28 22:11 692次阅读
    选择 KV <b class='flag-5'>数据库</b>最重要的是什么?

    GaussDB(for Redis) 特性揭秘:多租户管理

    华为 GaussDB(for Redis)持续完善企业级增强特性,是名副其实的 "Redis Plus" ,其中很经典的企业级特性是 多租户能力 ,支持添加只读账号、读写账号,且具备强大的 DB
    的头像 发表于 03-28 22:06 742次阅读
    <b class='flag-5'>GaussDB</b>(for Redis) 特性<b class='flag-5'>揭秘</b>:多租户管理

    企业组网如何兼顾低成本高性能

    在数字化浪潮席卷全球的今天,企业的网络需求变得愈加复杂和多样化。面对激烈的市场竞争,企业不得不寻求一种既能降低成本又能保证高性能的网络解决方案。传统组网方式虽然稳定可靠,但昂贵的硬件投入和升级成本
    的头像 发表于 02-26 14:59 388次阅读