此次TigerGraph在 36TB 规模的 LDBC SNB(社交网络基准) 基准测试,为全新的测试,完全遵循了LDBC规范,所有BI query都通过测试(该报告中包含了所有结果),包含5396亿条边和726亿个顶点。到目前为止,TigerGraph依然是唯一可以完成36TB LDBC BI workload的图数据库供应商,并且完全可以通过第三方审计。
新的基准测试使用了新版本的TigerGraph,在加载和查询方 面都有改进(例如,加载时间从 35.5 小时缩短到6.5 小时,提升了将近5倍。power batch 的平均查询时间从236.06秒缩短到99.90秒),提升了1.4倍。并且结果得到了SF-10上的另一个图数据库的交叉验证。
该报告记录了TigerGraph在SF-30k上的LDBC SNB BI工作负载的完整执行。这个基准测试正在等待LDBC的审计,它使用的官方基准驱动程序、查询实现、数据和替 换参数生成器,都与TigerGraph在LDBC SNB SF-1000的审计报告中使用的相同。不同的是,这次的规模因子为SF-30k(即30TB级别)。在每批的查询中使用5个替换参数执行,而官方基准测试使用30个不同的参数。power 和throughput 基准指标都是按照LDBC SNB规范的指南报告。
TigerGraph 是一个大规模并行处理 (MPP) 图数据库管理系统,旨在处理混合事务/分析处理 (HTAP) 查询工作负载。它是一个分布式平台,使用原生图存储格式和领先的分区策略。其中,每个图分区都包含相似数量的顶点和边,支持并行处理请求。TigerGraph提供 GSQL,这是一种图灵完备的查询语言,它具有声明式特性(例如,图模式匹配)和命令式特性(例如用于表达带有循环和累加器原语的迭代图算法)。
该基准测试的重点是 TigerGraph 在一系列批量刷新的大图上的商业智能 (BI) 工作负载性能。BI 工作负载包括:
20 个只读查询——大多数 OLAP 式的迭代和深度链接图查询在不到一分钟到几分钟内就可以得到回答。查询包括加权图上的爆炸性和冗余多连接以及多源最 短路径问题。
增量批量更新——图通过一组插入和删除操作而发生变化。插入或删除数据的批量处理周期为1天。
TigerGraph 服务器被部署在 36 个具有144TB 磁盘容量的Amazon Web Service (AWS) r6a.32xlarge 实例上。这些实例由第三代 AMD EPYC 处理器提供支持。以下摘要突出了一些关键数字:
总体而言,完整的源数据集约为36TB,包含5396亿条边和726亿个顶点。
基准测试总时间为19.3 小时,包括初始数据加载、1 次 power batch运行和 1 次throughput batch运行。
硬件成本为281.27 美元/小时,包括 36 台 A WS 机器和144T GP2 SSD 卷
该基准测试清楚地证明了:
TigerGraph在执行复杂查询时能够扩展到更大的数据集的空前能力,这被认为比关系联接更具挑战性;
TigerGraph适用于各种关系数据处理场景,尤其在数据量大、经常有数据更新、需要快速实现复杂大数据量全图计算(OLAP)的场景表现格外优异;
TigerGraph在实际生产环境中处理大图工作负载的能力,在这种环境中,数十TB的关联数据每小时或每天增量更新是一种常态。据我们所知,其它图数据库或关系数据库供应商,没有一家可以在这种大规模可更新的图上展示出同等的分析和操作能力。
审核编辑 :李倩
-
数据库
+关注
关注
7文章
3795浏览量
64364 -
生成器
+关注
关注
7文章
315浏览量
21003
原文标题:LDBC SNB SF30000 基准测试报告全面披露
文章出处:【微信号:TigerGraph,微信公众号:TigerGraph】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论