QuestDB时序数据库性能居然领先ClickHouse和InfluxDB这么多-电子发烧友网

作者：Vlad Ilyushchenko，QuestDB的CTO

在QuestDB (https://questdb.io/， https://github.com/questdb/questdb)，我们已经建立了一个专注于性能的开源时间序列数据库。我们创建QuestDB初衷是为了将我们在超低延迟交易方面的经验以及我们在该领域开发的技术方法带到各种实时数据处理用途中。

QuestDB的旅程始于2013年的原型设计，我们在去年HackerNews发布会期间（https://news.ycombinator.com/item?id=23975807）发表的一篇文章中描述了2013年之后所发生的变化。我们的用户在金融服务、物联网、应用监控和机器学习领域都部署了QuestDB，使时间序列分析变得快速、高效和便捷。

什么是存储时间序列数据的最佳方式？

在项目的早期阶段，我们受到了基于矢量的append-only系统（如kdb+）的启发，因为这种模型带来了速度和简洁代码路径的优势。QuestDB的数据模型使用了我们称之为基于时间的数组，这是一种线性数据结构。这允许QuestDB在数据获取过程中把数据切成小块，并以并行方式处理所有数据。以错误的时间顺序到达的数据在被持久化到磁盘之前会在内存中进行处理和重新排序。因此，数据在到达数据库中之前已经按时间排序。因此，QuestDB不依赖计算密集的索引来为任何时间序列的查询重新排序数据。

这种liner模型与其他开源数据库（如InfluxDB或TimescaleDB）中的LSM树或基于B树的存储引擎不同。

除了更好的数据获取能力，QuestDB的数据布局使CPU能够更快地访问数据。我们的代码库利用最新CPU架构的SIMD指令，对多个数据元素并行处理同类操作。我们将数据存储在列中，并按时间进行分区，以在查询时从磁盘中提取最小的数据量。

数据被存储在列中，并按时间进行分区

QuestDB与ClickHouse、InfluxDB和TimescaleDB相比如何？

我们看到时间序列基准测试套件（TSBS https://github.com/timescale/tsbs）经常出现在关于数据库性能的讨论，因此我们决定提供对QuestDB和其他系统进行基准测试的能力。TSBS是一个Go程序集，用于生成数据集，然后对读写性能进行基准测试。该套件是可扩展的，因此可以包括不同的用例和查询类型，并在不同系统之间进行比较。

以下是我们在AWS EC2 m5.8xlarge实例上使用多达14个worker的纯cpu用例的基准测试结果，该实例有16个内核。

TSBS结果比较了QuestDB、InfluxDB、ClickHouse和TimescaleDB的最大获取吞吐量。

我们使用4个worker达到最大的摄取性能，而其他系统需要更多的CPU资源来达到最大的吞吐量。QuestDB用4个线程达到了95.9万行/秒。我们发现InfluxDB需要14个线程才能达到最大的摄取率（334k行/秒），而TimescaleDB用4个线程达到145k行/秒。ClickHouse以两倍于QuestDB的线程达到914k行/秒。

当在4个线程上运行时，QuestDB比ClickHouse快1.7倍，比InfluxDB快6.5倍，比TimescaleDB快6.6倍。

使用4个线程的TSBS基准测试结果：QuestDB、InfluxDB、ClickHouse和TimescaleDB每秒获取的行数。

当我们使用AMD Ryzen5处理器再次运行该套件时，我们发现，我们能够使用5个线程达到每秒143万行的最大吞吐量。与我们在AWS上的参考基准m5.8xlarge实例所使用的英特尔至强Platinum相比：

比较QuestDB TSBS在AWS EC2与AMD Ryzen5上的负载结果

你应该如何存储乱序的时间序列数据？

事实证明，在摄取过程中对 "乱序"（O3）的数据进行重新排序特别具有挑战性。这是一个新的方法，我们想在这篇文章中详细介绍一下。我们对如何处理失序摄取的想法是增加一个三阶段的方法。

1.保持追加模式，直到记录不按顺序到达为止

2.在内存中对暂存区的未提交的记录进行排序

3.在提交时对分类的无序数据和持久化的数据进行核对和合并

前两个步骤很直接，也很容易实现，依然只是处理追加的数据，这一点没变。只有在暂存区有数据的时候，昂贵的失序提交才会启动。这种设计的好处是，输出是向量，这意味着我们基于向量的阅读器仍然是兼容的。

这种预提交的排序和合并方式给数据获取增加了一个额外的处理阶段，同时也带来了性能上的损失。不过，我们还是决定探索这种方法，看看我们能在多大程度上通过优化失序提交来减少性能损耗。

我们如何分类、合并和提交无序的时间序列数据

处理一个暂存区给了我们一个独特的机会来全面分析数据，在这里我们可以完全避免物理合并，并通过快速和直接的memcpy或类似的数据移动方法来替代。由于我们的基于列的存储，这种方法可以被并行化。我们可以采用SIMD和非时序数据访问，这对我们来说是很重要的。

我们通过优化版本的radix排序对来自暂存区的时间戳列进行排序，所产生的索引被用于并行对暂存区的其余列进行排序。

并行得将列进行排序

现在排序的暂存区是相对于现有分区数据进行映射的。从一开始可能并不明显，但我们正试图为以下三种类型的每一种建立所需的操作和维度。

失序（O3）排序和合并方案

当以这种方式合并数据集时，前缀和后缀组可以是持续的数据、失序的数据，或者没有数据。合并组(Merge Group)是最繁忙的，因为它可以被持久化的数据、失序的数据、失序的数据和持久化的数据占据，或者没有数据。

当明确了如何分组和处理暂存区的数据时，一个工人池就会执行所需的操作，在少量的情况下调用memcpy，其他都转向SIMD优化的代码。通过前缀、合并和后缀拆分，提交的最大活度（增加CPU容量的易感性）可以通过partition_affected x number_of_columns x 3得到。

时间序列数据应该多久进行一次排序和合并？

能够快速复制数据是一个不错的选择，但我们认为在大多数时间序列获取场景中可以避免大量的数据复制。假设大多数实时失序的情况是由传递机制和硬件抖动造成的，我们可以推断出时间戳分布将在一定区间范围。

例如，如果任何新的时间戳值有很大概率落在先前收到的值的10秒内，那么边界就是10秒，我们称这个为滞后边界。

当时间戳值遵循这种模式时，推迟提交可以使失序提交成为正常的追加操作。失序系统可以处理任何种类的延迟，但如果延迟的数据在指定的滞后边界内到达，它将被优先快速处理。

如何比较时间序列数据库的性能

我们已经在TimescaleDB的TSBS GitHub仓库中开启了一个合并请求(Questdb基准支持 https://github.com/timescale/tsbs/issues/157)，增加了针对QuestDB运行基准测试的能力。同时，用户可以克隆我们的基准测试fork(https://github.com/questdb/tsbs)，并运行该套件以查看自己的结果。

tsbs_generate_data --use-case="cpu-only" --seed=123 --scale=4000 `。

--timestamp-start="2016-01-01T00:00:00Z" --timestamp-end="2016-01-02T00:00:00Z" \

--log-interval="10s" --format="influx" > /tmp/bigcpu

tsbs_load_questdb --file /tmp/bigcpu --workers 4

构建具有授权许可的开源数据库

在进一步推动数据库性能的同时，使开发人员能够轻松地开始使用我们的产品，这一点每天都激励着我们。这就是为什么我们专注于建立一个坚实的开发者社区，他们可以通过我们的开源分销模式参与并改进产品。

除了使QuestDB易于使用之外，我们还希望使其易于审计、审查，提交代码或其他的项目贡献。QuestDB的所有源代码都在GitHub（https://github.com/questdb/questdb）上以Apache 2.0许可证提供，我们欢迎对此产品的各种贡献，包括在GitHub上创建issue或者提交代码。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

云数据库是哪种数据库类型？

云数据库是一种部署在虚拟计算环境中的数据库，它融合了云计算的弹性和可扩展性，为用户提供高效、灵活的数据库服务。云数据库主要分为两大类：关系型数据库

发表于 01-07 10:22 •52次阅读

时序数据库TDengine 2024年保持高增长，实现收入翻倍

近日，时序数据库 (Time Series Database) TDengine 正式公布了 2024 年重大成就和发展成绩盘点。在这一年中，TDengine 以持续创新的技术能力、迅猛增长的市场

发表于 01-02 13:50 •116次阅读

数据库数据恢复—Mysql数据库表记录丢失的数据恢复流程

Mysql数据库故障： Mysql数据库表记录丢失。 Mysql数据库故障表现： 1、Mysql数据库表中无任何数据或只有部分

发表于 12-16 11:05 •177次阅读

ClickHouse：强大的数据分析引擎

作者：京东物流陈昌浩最近的工作中接触到CK，一开始还不知道CK是什么,通过查询才知道CK是ClickHouse，ClickHouse 是俄罗斯的Yandex于2016年开源的列式存储数据库

发表于 12-10 10:23 •92次阅读

数据库数据恢复—MYSQL数据库ibdata1文件损坏的数据恢复案例

mysql数据库故障： mysql数据库文件ibdata1、MYI、MYD损坏。故障表现：1、数据库无法进行查询等操作；2、使用mysqlcheck和myisamchk无法修复数据库

发表于 12-09 11:05 •175次阅读

数据库数据恢复—通过拼接数据库碎片恢复SQLserver数据库

一个运行在存储上的SQLServer数据库，有1000多个文件，大小几十TB。数据库每10天生成一个NDF文件，每个NDF几百GB大小。数据库包含两个LDF文件。存储损坏，数据库不

发表于 10-31 13:21 •255次阅读

有云服务器还需要租用数据库吗？

如果你的应用程序需要处理大量的数据，并且这些数据需要高效的查询和分析能力，那么租用专业的数据库服务可能是更好的选择。这些服务通常提供了更高的性能、更好的可扩展性和更强的

发表于 10-31 10:50 •114次阅读

数据库数据恢复—SQL Server数据库出现823错误的数据恢复案例

SQL Server数据库故障： SQL Server附加数据库出现错误823，附加数据库失败。数据库没有备份，无法通过备份恢复数据库。

发表于 09-20 11:46 •365次阅读

利用NVIDIA RAPIDS加速DolphinDB Shark平台提升计算性能

DolphinDB 是一家高性能数据库研发企业，也是 NVIDIA 初创加速计划成员，其开发的产品基于高性能分布式时序数据库，是支持复杂计算和流数据

发表于 09-09 09:57 •478次阅读

小米试点业务系统上线OceanBase，数据库性能飞跃新高度

在科技日新月异的今天，小米集团作为全球领先的智能设备制造商，其业务的快速发展对底层技术架构提出了前所未有的挑战。特别是在数据库领域，面对海量数据处理、高并发访问以及严苛的故障应对需求，传统数据

发表于 07-03 15:39 •683次阅读

时序数据库是什么？时序数据库的特点

时序数据库是一种在处理时间序列数据方面具有高效和专门化能力的数据库。它主要用于存储和处理时间序列数据，比如传感器数据、监控

发表于 04-26 16:02 •672次阅读

LabVIEW操作InfluxDB数据库应用特点和原理概念

InfluxDB的行协议是一种写入数据点到InfluxDB的文本格式。必须要是这样的格式的数据点才能被Influxdb解析和写入成功，当然除

发表于 04-12 12:21 •1398次阅读

华为云多模数据库 GeminiDB 架构与应用实践直播问答实录

多模数据库作为一种新兴的数据管理解决方案，正在受到越来越多的关注。而华为云多模数据库 GeminiDB 基于云原生

发表于 04-08 18:25 •1176次阅读

搭载英伟达GPU，全球领先的向量数据库公司Zilliz发布Milvus2.4向量数据库

在美国硅谷圣何塞召开的 NVIDIA GTC 大会上，全球领先的向量数据库公司 Zilliz 发布了 Milvus 2.4 版本。这是一款革命性的向量数据库系统，在业界首屈一指，它首次采用了英伟达

发表于 04-01 14:33 •490次阅读

【数据库数据恢复】Oracle数据库ASM实例无法挂载的数据恢复案例

oracle数据库ASM磁盘组掉线，ASM实例不能挂载。数据库管理员尝试修复数据库，但是没有成功。

发表于 02-01 17:39 •535次阅读