火山引擎：ClickHouse增强计划之“Upsert”-电子发烧友网

相信大家都对大名鼎鼎的ClickHouse有一定的了解了，它强大的数据分析性能让人印象深刻。但在字节大量生产使用中，发现了ClickHouse依然存在了一定的局限。例如：

• 缺少完整的upsert和delete操作

• 多表关联查询能力弱

• 集群规模较大时可用性下降（对字节尤其如此）

• 没有资源隔离能力

因此，我们决定将ClickHouse能力进行全方位加强，打造一款更强大的数据分析平台。后面我们将从五个方面来和大家分享，本篇将详细介绍我们是如何为ClickHouse补全更新删除能力的。

实时人群圈选场景遇到的难题

在电商业务中，人群圈选是非常常见的一个场景。字节原有的离线圈选的方案是以T+1的方式更新数据，而不是实时更新，这很影响业务侧的体验。现在希望能够基于实时标签，在数据管理平台中构建实时人群圈选的能力。整体数据链路如下：

为了保证实时数据和离线数据同时提供服务，在标签接入完毕后，在ClickHouse中完成宽表加工任务。但是原生ClickHouse只支持追加写的能力，只有ReplacingMergeTree这种方案。但是选用ReplacingMergeTree引擎的限制比较多，不能满足业务的需求，主要体现在：

• 性能下降严重，ReplacingMergeTree采用的是写优先的设计逻辑，这导致读性能损失严重。表现是在进行查询时性能较ClickHouse其他引擎的性能下降严重，涉及ReplacingMergeTree的查询响应时间过慢。

• ReplacingMergeTree引擎只支持数据的更新，并不支持数据的删除。只能通过CollaspingMergeTree来实现数据清除，通过不同的表引擎分别提供更新删除能力会让系统复杂度进一步提升。

• ReplacingMergeTree中的去重是 Merge 触发的，在刚导入的数据时是不去重的，过一段时间后才会在分区内去重。

ByteHouse的解决方案：UniqueMergeTree

在这种情况下，字节在ByteHouse（火山引擎上基于ClickHouse能力增强的版本）中开发了一种支持实时更新删除的表引擎：UniqueMergeTree。UniqueMergeTree与以往的表引擎有什么差别呢？下面介绍两种支持实时更新的常见技术方案：

原生ClickHouse选择的技术方案

原生ClickHouse的更新表引擎ReplacingMergeTree使用Merge on Read的实现逻辑，整个思想比较类似LSMTree。对于写入，数据先根据key排序，然后生成对应的列存文件。每个Batch写入的文件对应一个版本号，版本号能用来表示数据的写入顺序。

同一批次的数据不包含重复key，但不同批次的数据包含重复key，这就需要在读的时候去做合并，对key相同的数据返回去最新版本的值，所以叫merge on read方案。原生ClickHouse ReplacingMergeTree用的就是这种方案。

大家可以看到，它的写路径是非常简单的，是一个很典型的写优化方案。它的问题是读性能比较差，有几方面的原因。首先，key-based merge通常是单线程的，比较难并行。其次merge过程需要非常多的内存比较和内存拷贝。最后这种方案对谓词下推也会有一些限制。大家用过ReplacingMergeTree的话，应该对读性能问题深有体会。

这个方案也有一些变种，比如说可以维护一些index来加速merge过程，不用每次merge都去做key的比较。

面向读优化的新方案

UniqueMergeTree使用的技术方案Mark-Delete + Insert方案刚好反过来，是一个读优化方案。在这个方案中，更新是通过先删除再插入的方式实现的。

Ref “Enhancements to SQLServer Column Stores”

下面以SQLServer的Column Stores为例介绍下这个方案。图中，每个RowGroup对应一个不可变的列存文件，并用Bitmap来记录每个RowGroup中被标记删除的行号，即DeleteBitmap。处理更新的时候，先查找key所属的RowGroup以及它在RowGroup中行号，更新RowGroup的DeleteBitmap，最后将更新后的数据写入Delta Store。查询的时候，不同RowGroup的扫描可以完全并行，只需要基于行号过滤掉属于DeleteBitmap的数据即可。

这个方案平衡了写和读的性能。一方面写入时需要去定位key的具体位置，另一方面需要处理write-write冲突问题。

这个方案也有一些变种。比如说写入时先不去查找更新key的位置，而是先将这些key记录到一个buffer中，使用后台任务将这些key转成DeleteBitmap。然后在查询的时候通过merge on read的方式处理buffer中的增量key。

Upsert和Delete使用示例

首先我们建了一张UniqueMergeTree的表，表引擎的参数和ReplacingMergeTree是一样的，不同点是可以通过UNIQUE KEY关键词来指定这张表的唯一键，它可以是多个字段，可以包含表达式等等。

下面对这张表做写入操作就会用到upsert的语义，比如说第6行写了四条数据，但只包含1和2两个key，所以对于第7行的select，每个key只会返回最高版本的数据。对于第11行的写入，key 2是一个已经存在的key，所以会把key 2对应的name更新成B3; key 3是新key，所以直接插入。最后对于行删除操作，我们增加了一个delete flag的虚拟列，用户可以通过这个虚拟列标记Batch中哪些是要删除，哪些是要upsert。

UniqueMergeTree表引擎的亮点

• 对于Unique表的写入，我们会采用upsert的语义，即如果写入的是新key，那就直接插入数据；如果写入的key已经存在，那就更新对应的数据。

• UniqueMergeTree表引擎既支持行更新的模式，也支持部分列更新的模式，用户可以根据业务要求开启或关闭。

• ByteHouse也支持指定Unique Key的value来删除数据，满足实时行删除的需求。支持指定一个版本字段来解决回溯场景可能出现的低版本数据覆盖高版本数据的问题。

• 最后ByteHouse也支持数据在多副本的同步，避免整体系统存在单点故障。

在性能方面，我们对UniqueMergeTree的写入和查询性能做了性能测试，结果如下图（箭头前是ReplacingMergeTree的消耗时间，箭头后是UniqueMergeTree的消耗时间）。

可以看到，与ReplacingMergeTree相比，UniqueMergeTree的写入性能虽然略有下降，但在查询性能上取得了数量级的提升。我们进一步对比了UniqueMergeTree和普通MergeTree的查询性能，发现两者是非常接近的。

增强后的实施人群圈选

经过UniqueMergeTree的加持，在原有架构不变的情况下，完美的满足了实时人群圈选场景的要求。

1、通过Unique Key配置唯一键，提供upsert更新写语义，查询自动返回每个唯一键的最新值

2、性能：单shard写入吞吐可以达到10k+行/s；查询性能与原生CH表几乎相同

3、支持根据Unique Key实时删除数据

此外，ByteHouse还通过UniqueMergeTree支持了一些其他特性：

1、唯一键支持多字段和表达式

2、支持分区级别唯一和表级别唯一两种模式

3、支持自定义版本字段，写入低版本数据时自动忽略

4、支持多副本部署，通过主备异步复制保障数据可靠性

不仅在实时人群圈选场景，ByteHouse提供的upsert能力已经服务于字节内部众多应用，线上应用的表数量有数千张，受到实时类应用的广泛欢迎。

除Upsert能力外，ByteHouse在为原生ClickHouse的企业级能力进行了全方位的增强。下一期，我们将介绍ClickHouse增强计划之“多表关联查询”，大家有兴趣一定不要错过。

审核编辑：李倩

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

引擎

引擎

+关注

关注
1

文章
361

浏览量
22579
数据分析

数据分析

+关注

关注
2

文章
1451

浏览量
34069
key

key

+关注

关注
0

文章
49

浏览量
12827

原文标题：火山引擎：ClickHouse增强计划之“Upsert”

文章出处：【微信号：芋道源码，微信公众号：芋道源码】欢迎添加关注！文章转载请注明出处。

英特尔与火山引擎等合作，夯实AI应用智能底座

在近期举办的火山引擎2024 FORCE原动力大会上，英特尔携手火山引擎及扣子Coze等生态伙伴，共同展示了在智能计算领域的最新合作成果。会上，英特尔与

发表于 12-25 11:47 •338次阅读

中科创达携手火山引擎开启AI智能座舱新体验

12月18日至19日，"2024火山引擎FORCE原动力大会·冬"在上海隆重召开。中科创达作为火山引擎的重要生态合作伙伴受邀参与此次盛会，并在会上展示了与

发表于 12-19 15:45 •221次阅读

机智云邀您相约2024冬季火山引擎FORCE原动力大会

12月18日～19日，2024冬季火山引擎FORCE原动力大会在上海世博中心举行，将围绕前沿技术、行业落地、AI 创业机遇等话题，深入产业探讨AI转型机遇。同时会上将发布多款大模型方案，机智云AI大模型模组邀您参会，扫码报名！

发表于 12-19 09:49 •286次阅读

ClickHouse：强大的数据分析引擎

作者：京东物流陈昌浩最近的工作中接触到CK，一开始还不知道CK是什么,通过查询才知道CK是ClickHouse，ClickHouse 是俄罗斯的Yandex于2016年开源的列式存储数据库

发表于 12-10 10:23 •86次阅读

<b class='flag-5'>ClickHouse</b>：强大的数据分析<b class='flag-5'>引擎</b>

英特尔与火山引擎飞连携手升级AI时代企业IT管理体验

在 AI 技术的推动下，企业 IT 管理正经历一场革命。日前，火山引擎飞连新品发布会成功举办。英特尔受邀参与此次活动，并在会上展示了新一代英特尔凌动 x7000 系列处理器等产品，与火山引擎

发表于 11-14 17:17 •538次阅读

中科创达与火山引擎达成深度合作

近日，中科创达与火山引擎在成都盛美利亚酒店隆重举行深度合作签署仪式。火山引擎汽车行业总经理杨立伟、中科创达执行总裁常衡生见证签约，火山

发表于 11-04 14:34 •298次阅读

火山引擎推出豆包·视频生成模型

在近期举办的2024火山引擎AI创新巡展上，火山引擎总裁谭待隆重推出了豆包·视频生成模型，这一举措标志着火山

发表于 09-25 14:11 •309次阅读

供应链场景使用ClickHouse最佳实践

关于ClickHouse的基础概念这里就不做太多的赘述了，ClickHouse官网都有很详细说明。结合供应链数字化团队在使用ClickHouse时总结出的一些注意事项，尤其在命名方面要求研发严格遵守

发表于 07-18 15:05 •294次阅读

小米小爱同学携手火山引擎,共启智能新篇章

在数字化浪潮汹涌的今日，人工智能技术的发展日新月异，其应用场景也在不断拓宽。近日，科技界的这一趋势又迎来了一次重要的里程碑事件——小米旗下备受用户喜爱的人工智能助手“小爱同学”与字节跳动旗下的火山引擎达成了战略合作，标志着双方将共同探索人工智能领域的新可能。

发表于 06-13 15:33 •740次阅读

ClickHouse内幕（3）基于索引的查询优化

ClickHouse索引采用唯一聚簇索引的方式，即Part内数据按照order by keys有序，在整个查询计划中，如果算子能够有效利用输入数据的有序性，对算子的执行性能将有巨大的提升。本文讨论

发表于 06-11 10:46 •1035次阅读

火山引擎携手东软睿驰等成立汽车大模型生态联盟

近日，备受瞩目的2024春季火山引擎FORCE原动力大会在北京盛大举行。在大会的瞩目环节，火山引擎携手中国电动汽车百人会，以及包括东软睿驰、吉利汽车、长城汽车、捷途汽车、赛力斯、智己汽

发表于 06-04 11:16 •1099次阅读

火山引擎与南开大学深化合作签约，携手共建“AI+教育”新生态

近日，在2024春季火山引擎FORCE原动力大会实体产业及教科研专场上，南开大学与火山引擎成功举办了深度合作签约仪式。此次合作标志着双方将携手共筑“AI+教育”的新篇章，共同推动教育行

发表于 05-20 11:16 •618次阅读

东软睿驰成为“火山引擎汽车大模型生态联盟”首批会员

5月15日，2024春季火山引擎FORCE原动力大会在北京举办，会上火山引擎联合中国电动汽车百人会，与东软睿驰及吉利汽车、长城汽车、捷途汽车、赛力斯、智己汽车等20余家厂商宣布成立汽车

发表于 05-17 11:54 •542次阅读

火山引擎携手OPPO、vivo等成立智能终端大模型联盟

在字节跳动2024年春季火山引擎Force原动力大会上，火山引擎携手OPPO、vivo、荣耀、小米、三星及华硕等业界翘楚，正式宣布成立智能终端大模型联盟。这一联盟的成立，旨在共同推动大

发表于 05-16 10:25 •540次阅读

火山引擎联手多手机厂商启动智能终端大模型联盟，对外开放

此外，OPPO的小布助手、荣耀的智慧办公智能助手、小米的“小爱同学”及华硕的笔记本电脑豆叮AI助手中，都已经采用了火山引擎的大模型服务。

发表于 05-15 15:02 •684次阅读

搜索历史

火山引擎：ClickHouse增强计划之“Upsert”

评论

英特尔与火山引擎等合作，夯实AI应用智能底座

中科创达携手火山引擎开启AI智能座舱新体验

机智云邀您相约2024冬季火山引擎FORCE原动力大会

ClickHouse：强大的数据分析引擎

英特尔与火山引擎飞连携手升级AI时代企业IT管理体验

中科创达与火山引擎达成深度合作

火山引擎推出豆包·视频生成模型

供应链场景使用ClickHouse最佳实践

小米小爱同学携手火山引擎,共启智能新篇章

ClickHouse内幕（3）基于索引的查询优化

火山引擎携手东软睿驰等成立汽车大模型生态联盟

火山引擎与南开大学深化合作签约，携手共建“AI+教育”新生态

东软睿驰成为“火山引擎汽车大模型生态联盟”首批会员

火山引擎携手OPPO、vivo等成立智能终端大模型联盟

火山引擎联手多手机厂商启动智能终端大模型联盟，对外开放