0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

查询优化器有多重要

jf_ro2CN3Fa 来源:芋道源码 作者:芋道源码 2022-10-25 17:03 次阅读

相信大家都对大名鼎鼎的ClickHouse有一定的了解了,它强大的数据分析性能让人印象深刻。但在字节大量生产使用中,发现了ClickHouse依然存在了一定的限制。例如:

缺少完整的upsert和delete操作

多表关联查询能力弱

集群规模较大时可用性下降(对字节尤其如此)

没有资源隔离能力

因此,我们决定将ClickHouse能力进行全方位加强,打造一款更强大的数据分析平台。后面我们将从五个方面来和大家分享,此前两篇内容分别为大家介绍了“更新删除”和“多表关联查询”,本篇将详细介绍我们是如何构建ClickHouse的查询优化器。

查询优化器有多重要?

在传统的关系型数据库中,如Oracle、DB2、MySQL,查询优化器都是作为几个最重要的核心组件之一。可以说,没有查询优化器的数据库是不完整的。相对 OLTP 而言在OLAP领域中更是如此;对于分析类场景,查询更为复杂,计划好坏的差异更大。一个优秀的查询优化器可以防止用户写出不好的SQL导致执行速度慢,能够准确的选择出一条效率最高的执行路径,大幅度降低查询时间。相应的,一个不好的查询优化器,甚至会让查询变慢。

常见的优化器逻辑分为两类,一类叫“基于规则的优化(RBO)”,另一类称为“基于代价的优化(CBO)”,实际应用过程中应当两类兼顾才能取得最佳效果。

基于规则的优化

根据优化规则对关系表达式进行转换,这里的转换是说一个关系表达式经过优化规则后会变成另外一个关系表达式,同时原有表达式会被裁剪掉,经过一系列转换后生成最终的执行计划。RBO中包含了一套有着严格顺序的优化规则,同样一条SQL,无论读取的表中数据是怎么样的,最后生成的执行计划都是一样的。同时,在RBO中SQL写法的不同很有可能影响最终的执行计划,从而影响脚本性能。

基于代价的优化

根据优化规则对关系表达式进行转换,这里的转换是说一个关系表达式经过优化规则后会生成另外一个关系表达式,同时原有表达式也会保留,经过一系列转换后会生成多个执行计划,然后CBO会根据统计信息和代价模型(Cost Model)计算每个执行计划的Cost,从中挑选Cost最小的执行计划。

ByteHouse的查询优化器

目前主流的OLAP的引擎在查询优化器方面做的并不够好,尤其是ClickHouse。众所周知ClickHouse以快著称,但是它的快是采用了力大飞砖的方式,需要用户将数据预先生成大宽表,以避免过于复杂的多表查询从而获得高性能。而代价是,每次维度变化或新需求都需要大量操作,以及在必须使用多表关联进行分析的场景中显得十分无力。

作为一个企业级的OLAP数据库来说一个完善且强大的优化器是必不可少的,因此,ByteHouse从零开始自研的了查询优化器。

ec758896-5341-11ed-a3b6-dac502259ad0.png

查询优化的完整流程

上图描述了整个查询的执行流程,从 SQL parse 到执行期间所有内容全部进行了重新实现(其中紫色模块),构建了一套完整的且规范的查询优化器。

主要功能模块

Analyzers

Analyzers 目录包括两部分功能:

一个是 QueryRewriter,一方面是通过 AST 改写的方式实现一些语法特性;我们同时支持 Clickhouse SQL 和标准 SQL,所以另一方面是确保在 Clickhouse SQL 模式下 SQL 语义能和原生 Interpreter 执行模式一致。

另一个是 QueryAnalyzer,用于对改写完的 AST 进行语义的分析和验证。Analyzer 区分 ANSI SQL 和 Clickhouse SQL 两种模式。

QueryRewriter 针对 ANSI SQL 的改写主要有:

With CTE/view 展开;

UDF 展开;

特定函数的改写,比如将 count(*) 改写为 count(),将 countDistinct(...) 改写为 uniqExact(...);

QueryRewriter 针对 Clickhouse SQL 的改写主要有:

With CTE/view 展开;

UDF 展开;

特定函数的改写;

JoinToSubquery 展开,对应于 Interpreter 链路下的 JoinToSubqueryTransformVisitor;

Qualified name 归一化,对应于 Interpreter 链路下的 TranslateQualifiedNamesVisitor;

Alias 改写,对应于 Interpreter 链路下的 QueryNormalizer;

QueryAnalyzer 查询语义进行分析和校验,将 AST 抽象成出结构化的数据结构,为下一步构建 plan 提供数据。在该模块中标准 SQL 和 Clickhouse SQL 进行了区分,一套代码同时兼容两种语义。

QueryPlan

在 Analyze 之后则是利用 Analyze 出的数据结构构建初始的查询计划。QueryPlan 是在社区的 QueryPlanStep 基础上改进而来,一方面增加了序列化/反序列化方法,为了计划下发执行基于 QueryPlan 并非 AST 或者 SQL 文本。另一方面是对社区中不合理的 Step 进行更改,让每个 Step 仅仅表达关系代数的语义而非很多执行相关的内容和参数,而这些执行相关的信息则是在每个执行的 server 上构建执行 pipeline 时才真正进行获得。

Optimizer

构建完执行计划后则是最为关键最后为核心的优化器模块。PlanOptimizer 类是查询优化的入口类,首先会基于 PlanPattern 对 SQL的查询做一次粗粒度的分类,不同复杂度的查询使用不同的规则集合,提升效率。

优化器不管是 RBO 还是 CBO 本质上都是对查询做改写,只是改写的思路以及改写框架有不同的取舍。我们实现了三种改写框架,用于处理不同的场景:

基于 visitor 的改写框架:可以 Top-Down,也可以 Botton-Up 的 方式对一个 QueryPlan 做改写,它比较适合于带有上下文依赖的优化规则,例如 PredicatePushDown,需要把 Predicate 一层层的往下推。

基于 pattern-match 的改写框架:这种适合简单、通用的改写规则,例如对于两个连续的 Filter 做合并的动作,只要 QueryPlan 里面的 Sub Plan 符合 Filter-Filter 这样的 pattern,就可以 match 对应的优化规则,进行改写。

基于 Cascade 的改写框架:通过遍历等价计划,并将所有的等价计划存储在一个内存空间中,然后评估每种等价计划的代价,进而选择一种最优解。

查询优化器带来了什么

在性能方面,原生Clickhouse受限于缺少查询优化器,对于 TPC-DS测试集的99个SQL用例仅能正常运行很少一部分查询,即使通过手动改写 SQL 也仅能成功运行 80%的查询。在实现了完善的优化器之后可以直接运行全部 TPC-DS 原始 SQL,改进后的 Clickhouse 才这正可以算是可用的 OLAP 数据库。不仅仅是可以正常执行这些复杂查询,而且效率也得到了很大的提升,相对在没优化器的情况下手动改写的 SQL ,性能提升 6 倍以上。在内部的一些业务场景中性能也有近10倍的提升。

优化器的能力方面:

RBO:支持:列裁剪、分区裁剪、表达式简化、子查询解关联、谓词下推、冗余算子消除、Outer-JOIN 转 INNER-JOIN、算子下推存储、分布式算子拆分等常见的启发式优化能力。

CBO:基于 Cascade 搜索框架,实现了高效的 Join 枚举算法,以及基于 Histogram 的代价估算,对 10 表全连接级别规模的 Join Reorder 问题,能够全量枚举并寻求最优解,同时针对大于10表规模的 Join Reorder 支持启发式枚举并寻求最优解。CBO 支持基于规则扩展搜索空间,除了常见的 Join Reorder 问题以外,还支持 Outer-Join/Join Reorder,Magic Set Placement 等相关优化能力。

分布式计划优化:面向分布式MPP数据库,生成分布式查询计划,并且和 CBO 结合在一起。相对业界主流实现:分为两个阶段,首先寻求最优的单机版计划,然后将其分布式化。我们的方案则是将这两个阶段融合在一起,在整个 CBO 寻求最优解的过程中,会结合分布式计划的诉求,从代价的角度选择最优的分布式计划。对于 Join/Aggregate 的还支持 Partition 属性展开。

高阶优化能力:实现了 Dynamic Filter pushdown、单表物化视图改写、基于代价的 CTE (公共表达式共享)。

下面我们用TPC-DS标准测试集,来为大家展现一下添加优化器前后的差别:

在没有优化器时,仅能完成26个SQL的查询。而添加了优化器后,能够完整跑完TPC-DS的全部99个SQL,并且在此前能完成的查询中,性能也得到了极大的提升。

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储
    +关注

    关注

    13

    文章

    4323

    浏览量

    85927
  • 函数
    +关注

    关注

    3

    文章

    4333

    浏览量

    62723
  • 数据分析
    +关注

    关注

    2

    文章

    1451

    浏览量

    34074

原文标题:“吊打” ClickHouse,火山引擎数仓 SQL 查询性能 10x 提升!

文章出处:【微信号:芋道源码,微信公众号:芋道源码】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    MySQL优化查询性能优化查询优化的局限性与提示

    MySQL优化三:查询性能优化查询优化的局限性与提示
    发表于 06-02 06:34

    ENOB是什么? ENOB对于选择示波器多重要

    ENOB是什么?ENOB说明了什么?如何判断ENOB的大小?ENOB对于选择示波器多重要
    发表于 05-06 09:26

    何谓视频处理?它到底多重要

    何谓视频处理?它到底多重要
    发表于 06-08 06:56

    ADC参考电压多重要

    参考电压的问题。参考电压多重要,我们得要弄清楚它在ADC转换中扮演一个什么样的角色,弄清楚这个问题,我们需要从ADC的转换原理入手,一般单片机里面ADC模块使用的是逐次逼近型转换,也就是通过这种
    发表于 07-05 11:04

    嵌入式架构多重要

    嵌入式架构多重要?要做到嵌入式应用的代码逻辑清晰,且避免重复的造轮子,没有好的应用架构怎么行?如果没有好的架构,移植将会是一件很痛苦的事情。如果没有好的架构,复用是最大的难题,没法更大限度的复用原有的代码。接下来嵌入式ARM便和大家分享一下,嵌入式架构那些事儿……
    发表于 07-22 06:00

    单片机中的系统时钟多重要

    一、单片机中的系统时钟多重要?系统时钟就好比人的心脏,芯片没有时钟就是一块废料。51单片机不需要配置时钟,因为一个时钟管理所有的功能资源。STM32单片机低功耗的原因之一在于时钟。每个功能资源
    发表于 07-29 09:30

    嵌入式架构多重要

    嵌入式架构多重要?要做到嵌入式应用的代码逻辑清晰,且避免重复的造轮子,没有好的应用架构怎么行?如果没有好的架构,移植将会是一件很痛苦的事情。如果没有好的架构,复用是最大的难题,没法更大限度的复用
    发表于 10-27 08:15

    单片机中的系统时钟多重要

    单片机中的系统时钟多重要?STM32芯片的时钟简介,时钟从哪里来?芯片的系统时钟从哪里来?系统时钟如何向下分配时钟资源?
    发表于 11-02 07:24

    基于共享执行策略的间隔查询优化

    间隔查询作为重要查询类型,广泛应用在社交网络、信息检索和数据库领域.为了支持高效的间隔查询,涌现出多种优化技术.尽管已有方法能够快速响应单
    发表于 01-05 17:09 0次下载
    基于共享执行策略的间隔<b class='flag-5'>查询</b><b class='flag-5'>优化</b>

    SQL优化原理 - 查询优化综述

    摘要: 本文主要是对数据库查询优化的一个综述,包括查询优化分类、
    发表于 07-24 17:38 326次阅读
    SQL<b class='flag-5'>优化</b><b class='flag-5'>器</b>原理 - <b class='flag-5'>查询</b><b class='flag-5'>优化</b><b class='flag-5'>器</b>综述

    AppleID是什么 苹果官方科普多重要

    虽然时常和Apple ID打交道,但你知道Apple ID多重要吗?今天,苹果官方公众号进行了全面科普,再也不要把自己的Apple ID借给别人了。
    的头像 发表于 03-08 11:39 5717次阅读

    优化DBLE独立子查询教程

    前期开发反馈在使用独立子查询时,不论子查询中结果集几个,语句都会卡死迟迟得不到返回结果。但是如果去掉子查询,直接赋值查询很快得到返回结果。
    的头像 发表于 03-29 13:50 672次阅读

    一文终结SQL子查询优化

    查询(Subquery)的优化一直以来都是 SQL 查询优化中的难点之一。关联子查询的基本执行方式类似于 Nested-Loop,但是这种
    的头像 发表于 04-28 14:19 772次阅读
    一文终结SQL子<b class='flag-5'>查询</b><b class='flag-5'>优化</b>

    Cascades查询优化基本原理分析

    优化一般由三个组件组成:统计信息收集、开销模型、计划列举。 如图 2 所示,开销模型使用收集到的统计信息以及构造的不同开销公式,估计某个特定查询计划的成本,帮助优化
    的头像 发表于 12-15 09:38 485次阅读
    Cascades<b class='flag-5'>查询</b><b class='flag-5'>优化</b><b class='flag-5'>器</b>基本原理分析

    pcb应变测试多重要?一文了解!

    pcb应变测试多重要?一文了解!
    的头像 发表于 02-24 16:26 1120次阅读