0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

拒绝“爆雷”!GaussDB(for MySQL) 新上线了这个功能

jf_94205927 来源:jf_94205927 作者:jf_94205927 2023-06-30 09:51 次阅读

摘要:智能把控大数据量查询,防患系统奔溃于未然

什么是最大读取行

一直以来,大数据量查询是数据库 DBA 们调优的重点,DBA 们通常十八般武艺轮番上阵以期提升大数据查询的性能:例如分库分表、给表增加索引、设定合理的 WHERE 查询条件、限定单次查询的条数……

然而,DBA 再厉害,应用程序千千万,写代码的程序员万码奔腾,大数据量的查询像地雷,不定什么时候就爆了。比如隐藏在某段代码里的查询,因为一个新手程序员的经验不足,查询代码写得欠佳,没有 WHERE 子句或缺少索引引发了不必要的多行读取,甚至全表扫描,给服务器带来了过度的压力,导致业务执行缓慢,甚至最后服务器 OOM 崩溃。

为了避免这种“爆雷”,GaussDB(for MySQL)近期上线了最大读取行特性。优化器产生执行计划后,如果优化器预估的读取行数超过了所设置的最大读取行阈值,则自动中止查询,将雷的导火索切断。

这种机制的优点在于:执行计划阶段就对查询进行了干预,而不是语句开始执行后在执行过程中进行中断。既杜绝了劣质查询对服务器和业务运行造成的风险,又大大节省了时间和资源。

如何设置最大读取行

在 GaussDB(for MySQL)中,设置 rds_max_row_read,指定查询允许读取的最大行数。GaussDB(for MySQL)收到查询指令,执行查询之前,会对查询要读取的行数进行估计。当估值超过所设置的最大读取行时,将中止查询,即查询没有机会运行,提前规避不必要的资源消耗。

下面是一份测试数据,说明了开启最大读取行前后的差异。

假设表 t1 有 4M 大小的行,当开发人员或应用程序尝试运行以下查询时,运行需要 7 分钟。

mysql> SELECT * FROM t1;

WHERE 子句的缺失致使需要全表扫描,查询耗时长。对于更大的表,这类查询将需要更多的耗时,使服务器消耗更多资源,查询耗时甚至可能高达数小时。

最大读取行特性的使用,可以节省宝贵的时间和资源。比如假设将最大读取行数指定为 1000000:

mysql> set rds_max_row_read =1000000;

Query OK, 0 rows affected (0.00 sec)

修改后,重新运行不含 WHERE 子句的查询,收到了读取行超限的提示,查询被停止。

mysql> SELECT * FROM t1;

ERROR HY000: Expected number of read rows exceeds the maximum allowed (see @@rds_max_row_read)

通过最大读取行,相当于拥有了一个工具,DBA 或者软件工程师根据业务情况可以自如设置和调整限制规则,保证业务正常运行的同时,限制次优查询,避免性能异常。

适用范围

适用于 SELECT、CREATE SELECT 和 INSERT SELECT。

功能开启

默认情况下,该功能是禁用的,只有当 rds_max_row_read 设置了值时,该功能才会被激活。

为了功能的稳定,避免无心的错误设置对业务造成不必要的影响,rds_max_row_read 做了最低值限制,不允许用户设置比最低值更低的值。

实现原理

wKgaomSeNQ2AcdSfAAEnhwCko5k152.png

GaussDB(for MySQL)通过遍历每个查询块并聚合各查询块的贡献来整体评估查询的读取行数:也就是对各 join 对象的读取行数评估后累加。

如果在累加评估过程中的某一刻,估计值超过了所设置的限制,查询将被终止。

对于关联子查询,评估办法为:评估子查询的读取行数,然后乘以查询被执行的次数。

需要特别说明的是,对每个 JOIN 对象的估计是执行计划预估返回的行数,可能与真实执行返回的行数有偏差。这虽然是一个相对简单的评估模型,但是我们坚信其具有足够的鲁棒性。

对于复杂查询,GaussDB(for MySQL)还通过 optimizer trace 提供了更多信息以帮助您确定优化器做决策的原因及如何优化查询。

示例

示例 1

mysql> EXPLAIN format=tree SELECT * FROM table_1, table_2;

+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------+

| EXPLAIN |

+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------+

| -> Inner hash join (no condition) (cost=6.50 rows=54)

-> Table scan on table_1 (cost=0.19 rows=9)

-> Hash

-> Table scan on table_2 (cost=0.85 rows=6)

|

+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------+

1 row in set (0.00 sec)

mysql> SET rds_max_row_read =20;

Query OK, 0 rows affected (0.00 sec)

mysql> SELECT * FROM table_1, table_2;

ERROR 1888 (HY000): The expected number of read rows exceeds the allowed maximum (see @@rds_max_row_read)

查询读取的行太多,我们尝试在 optimizer trace 的帮助下寻找原因:

SET optimizer_trace="enabled=on";

SELECT * from table_1, table_2;

SELECT * FROM INFORMATION_SCHEMA.OPTIMIZER_TRACE;

在 optimizer trace 中,可以找到:

{

"Max_row_read": {

"select#": 1,

"current_estimate_of_rows": 54,

"rows_contributed_by_this_query_block": 54

}

}

这表示此查询中的唯一查询块,行读取数为 54。

执行计划中的这个评估有多准确呢?

执行如下查询查看语句实际被执行的次数:

mysql> show status like "handler_read_rnd_next";

+----------------------------+-------+

| Variable_name | Value |

+----------------------------+-------+

| Handler_read_rnd_next | 17 |

+----------------------------+-------+

1 rows in set (0.00 sec)

handler_read_rnd_next 显示实际上的读取是 17 行,而不是 54 行。

这个 17 是怎么来的呢?

这是一个哈希连接:

-遍历整张表时,左表有 9 行数据+1 行额外行。

-右表有 6 行+1 行额外行。

优化器中会预估返回读取行,例如,54。在这个示例中,它并没有很好地猜测到返回的行数,它高估了行读取的数量。在大多数情况下,读取行数的估计不够精确,但可以肯定的是,它是足够稳健的,能达到相应的目的。

示例 2

创建例表 t1:

mysql> CREATE TABLE t1(a INT);

在表中填充 1536 行数据后。将 rds_max_row_read 设置为 500,进行以下测试查询:

mysql> SELECT * FROM t1 WHERE a>6;

ERROR HY000: Expected number of read rows exceeds the maximum allowed (see @@rds_max_row_read)

在 optimizer trac 的帮助下,可以看到优化器估计的读取行数是 512 行,因此查询被终止。如果在 a 字段上添加索引(这是一件明智的事情),同一查询的估计读取行数是 1,查询检测顺利通过。

这个简单的示例说明:最大读取行能帮助您编写更加优质的查询语句。

结论

最大读取行特性针对读取过多行的查询,识别和过滤出效率低下的查询。用户可以为读取行数设置阈值,超过该阈值则终止查询。为了识别此类查询,GaussDB(for MySQL)在优化器中进行了读取总行数的粗略估计。当查询终止时,可以检查 optimizer trace,从中收集线索,以帮助重写更高效的查询。

简而言之,最大读取行为用户提供了一个工具,使他们可以更充分地利用手上的资源。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为云
    +关注

    关注

    3

    文章

    2607

    浏览量

    17482
收藏 人收藏

    评论

    相关推荐

    华为云 Flexus X 实例评测使用体验——MySQL 安装全过程 +MySQL 读写速度测试

     前言 我这里我使用的默认公共镜像 Huawei Cloud EulerOS,因为这里有个标识说是可以对数据库添加加速功能,例如 Redis 和 MySQL 数据库都可以加速,我这里先测
    的头像 发表于 12-31 10:38 177次阅读
    华为云 Flexus X 实例评测使用体验——<b class='flag-5'>MySQL</b> 安装全过程 +<b class='flag-5'>MySQL</b> 读写速度测试

    MySQL还能跟上PostgreSQL的步伐吗

    Percona 的老板 Peter Zaitsev最近发表一篇博客,讨论MySQL是否还能跟上PostgreSQL的脚步。Percona 作为MySQL 生态扛旗者,Percona 开发了知名
    的头像 发表于 11-18 10:16 229次阅读
    <b class='flag-5'>MySQL</b>还能跟上PostgreSQL的步伐吗

    适用于MySQL的dbForge架构比较

    dbForge Schema Compare for MySQL 是一种工具,用于轻松有效地比较和部署 MySQL 数据库结构和脚本文件夹差异。该工具提供 MySQL 数据库架构中所
    的头像 发表于 10-28 09:41 226次阅读
    适用于<b class='flag-5'>MySQL</b>的dbForge架构比较

    华纳云:如何修改MySQL的默认端口

    更改MySQL的默认端口。 理解MySQL配置文件 MySQL的配置文件是控制服务器设置的关键。在不同的操作系统中,这个文件可能位于不同的位置: Linux: /etc/
    的头像 发表于 07-22 14:56 332次阅读
    华纳云:如何修改<b class='flag-5'>MySQL</b>的默认端口

    苹果发布《App Store透明度报告》:2023年拒绝176万款App

    此报告揭示,2022年App Store共审核6892500款应用程序,其中拒绝1763812款。这些应用主要因为性能、设计与法律问题未达到标准。同时,有277923款应用得到修改并成功上线
    的头像 发表于 05-18 10:18 820次阅读

    腾讯回应QQ微信上线地震预警功能

    5月13日,“QQ微信上线地震预警功能”引发热议,对此,腾讯回应:预警功能覆盖四川全省及周边50公里,全国微信地震预警服务平台即将上线
    的头像 发表于 05-13 11:31 666次阅读
    腾讯回应QQ微信<b class='flag-5'>上线</b>地震预警<b class='flag-5'>功能</b>

    MySQL的整体逻辑架构

    支持多种存储引擎是众所周知的MySQL特性,也是MySQL架构的关键优势之一。如果能够理解MySQL Server与存储引擎之间是怎样通过API交互的,将大大有利于理解MySQL的核心
    的头像 发表于 04-30 11:14 466次阅读
    <b class='flag-5'>MySQL</b>的整体逻辑架构

    MySQL忘记root密码解决方案

    mysql登录密码为password()算法加密,解密成本太高,以下为通用方案; 原理:mysql提供特殊启动方式,即跳过权限表验证,启动后,登录不需要提供密码; 登录后,即可修改
    的头像 发表于 04-23 16:08 730次阅读

    光刻机巨头阿斯麦业绩 ASML公司一季度订单下滑

    光刻机巨头阿斯麦业绩 ASML公司一季度订单下滑 光刻机巨头阿斯麦业绩,阿斯麦(ASML)在4月17日披露的一季度订单远低于市场预
    的头像 发表于 04-18 16:43 1251次阅读

    文心一言APP上线数字分身功能

    文心一言APP近日上线一项令人兴奋的新功能——数字分身。这一功能允许用户轻松创建自己的个性化虚拟形象,为用户带来全新的互动体验。
    的头像 发表于 02-04 10:32 1222次阅读

    OpenAI一键调用GPTs功能上线

    OpenAI近日宣布,其最新功能GPT Mentions现已上线。这一功能为用户提供一个便捷的方式来调用不同的GPTs(Generative Pre-trained Transfor
    的头像 发表于 02-04 10:05 844次阅读

    三大半导体巨头

    英特尔、电动汽车大厂特斯拉相继。对此,知名半导体分析师陆行之表示看法,认为Q1半导体股价又要等AI芯片大厂英伟达来神救援。 陆行之1月27日发文指出,在其追踪的10家全球半导体及科技公司公布2023年第四季度营收/获利及2
    的头像 发表于 01-31 15:41 626次阅读

    如何将MS访问数据转换为MySQL

    借助dbForgeStudio for MySQL,您可以轻松地将数据从MicrosoftAccess迁移到MySQL,并保持数据和功能的完整性。这个过程将允许您利用更具可伸缩性和
    的头像 发表于 01-23 13:47 441次阅读
    如何将MS访问数据转换为<b class='flag-5'>MySQL</b>

    阿里二面:了解MySQL事务底层原理吗

    MySQL 是如何来解决脏写这种问题的?没错,就是锁。MySQL 在开启一个事务的时候,他会将某条记录和事务做一个绑定。这个其实和 JVM 锁是类似的。
    的头像 发表于 01-18 16:34 347次阅读
    阿里二面:了解<b class='flag-5'>MySQL</b>事务底层原理吗

    MySQL密码忘记了怎么办?MySQL密码快速重置方法步骤命令示例!

    MySQL密码忘记了怎么办?MySQL密码快速重置方法步骤命令示例! MySQL是一种常用的关系型数据库管理系统,如果你忘记了MySQL的密码,不必担心,可以通过一些简单的步骤来快速重
    的头像 发表于 01-12 16:06 773次阅读