0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何优化MySQL中的join语句

jf_78858299 来源:Java识堂 作者:Java识堂 2023-04-24 17:03 次阅读

在mysql中,join 主要有Nested Loop、Hash Join、Merge Join 这三种方式,我们今天来看一下最普遍 Nested Loop 循环连接方式,主要包括三种:

  • Simple Nested-Loop Join:简单嵌套循环连接
  • Block Nested-Loop Join:缓存块嵌套循环连接
  • Index Nested-Loop Join:索引嵌套循环连接

Simple Nested-Loop Join

我们来看一下当进行 join 操作时,mysql是如何工作的。常见的 join 方式有哪些?图片如图,当我们进行连接操作时,左边的表是 「驱动表」 ,右边的表是**「被驱动表」**

Simple Nested-Loop Join 这种连接操作是从驱动表中取出一条记录然后逐条匹配被驱动表的记录,如果条件匹配则将结果返回。然后接着取驱动表的下一条记录进行匹配,直到驱动表的数据全都匹配完毕

「因为每次从驱动表取数据比较耗时,所以MySQL并没有采用这种算法来进行连接操作」

Block Nested-Loop Join

图片既然每次从驱动表取数据比较耗时,那我们每次从驱动表取一批数据放到内存中,然后对这一批数据进行匹配操作。这批数据匹配完毕,再从驱动表中取一批数据放到内存中,直到驱动表的数据全都匹配完毕

批量取数据能减少很多IO操作,因此执行效率比较高,这种连接操作也被MySQL采用

对了,这块内存在MySQ中有一个专有的名词,叫做 join buffer,我们可以执行如下语句查看 join buffer 的大小

show variables like '%join_buffer%'

图片

把我们之前用的 single_table 表搬出来,基于 single_table 表创建2个表,每个表插入1w条随机记录

CREATE TABLE single_table (
    id INT NOT NULL AUTO_INCREMENT,
    key1 VARCHAR(100),
    key2 INT,
    key3 VARCHAR(100),
    key_part1 VARCHAR(100),
    key_part2 VARCHAR(100),
    key_part3 VARCHAR(100),
    common_field VARCHAR(100),
    PRIMARY KEY (id),
    KEY idx_key1 (key1),
    UNIQUE KEY idx_key2 (key2),
    KEY idx_key3 (key3),
    KEY idx_key_part(key_part1, key_part2, key_part3)
) Engine=InnoDB CHARSET=utf8;

create table t1 like single_table;
create table t2 like single_table;

如果直接使用 join 语句,MySQL优化器可能会选择表 t1 或者 t2 作为驱动表,这样会影响我们分析sql语句的过程,所以我们用 straight_join 让mysql使用固定的连接方式执行查询

select * from t1 straight_join t2 on (t1.common_field = t2.common_field)

运行时间为0.035s图片执行计划如下图片在Extra列中看到了 Using join buffer ,说明连接操作是基于 「Block Nested-Loop Join」 算法

Index Nested-Loop Join

了解了 「Block Nested-Loop Join」 算法之后,可以看到驱动表的每条记录会把被驱动表的所有记录都匹配一遍,非常耗时,能不能提高一下被驱动表匹配的效率呢?

估计这种算法你也想到了,就是给被驱动表连接的列加上索引,这样匹配的过程就非常快,如图所示图片我们来看一下基于索引列进行连接执行查询有多快?

select * from t1 straight_join t2 on (t1.id = t2.id)

执行时间为0.001秒,可以看到比基于普通的列进行连接快了不止一个档次图片执行计划如下图片「驱动表的记录并不是所有列都会被放到 join buffer,只有查询列表中的列和过滤条件中的列才会被放入 join buffer,因此我们不要把 * 作为查询列表,只需要把我们关心的列放到查询列表就好了,这样可以在 join buffer 中放置更多的记录」

如何选择驱动表?

知道了 join 的具体实现,我们来聊一个常见的问题,即如何选择驱动表?

「如果是 Block Nested-Loop Join 算法:」

  1. 当 join buffer 足够大时,谁做驱动表没有影响
  2. 当 join buffer 不够大时,应该选择小表做驱动表(小表数据量少,放入 join buffer 的次数少,减少表的扫描次数)

「如果是 Index Nested-Loop Join 算法」

假设驱动表的行数是M,因此需要扫描驱动表M行

被驱动表的行数是N,每次在被驱动表查一行数据,要先搜索索引a,再搜索主键索引。每次搜索一颗树近似复杂度是以2为底N的对数,所以在被驱动表上查一行的时间复杂度是

驱动表的每一行数据都要到被驱动表上搜索一次,整个执行过程近似复杂度为

「显然M对扫描行数影响更大,因此应该让小表做驱动表。当然这个结论的前提是可以使用被驱动表的索引」

「总而言之,我们让小表做驱动表即可」

「当 join 语句执行的比较慢时,我们可以通过如下方法来进行优化」

  1. 进行连接操作时,能使用被驱动表的索引
  2. 小表做驱动表
  3. 增大 join buffer 的大小
  4. 不要用 * 作为查询列表,只返回需要的列
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 驱动
    +关注

    关注

    12

    文章

    1838

    浏览量

    85262
  • MySQL
    +关注

    关注

    1

    文章

    804

    浏览量

    26531
  • Join
    +关注

    关注

    0

    文章

    9

    浏览量

    3258
收藏 人收藏

    评论

    相关推荐

    MySQL的执行过程 SQL语句性能优化常用策略

    回顾 MySQL 的执行过程,帮助介绍如何进行 sql 优化
    的头像 发表于 12-12 10:26 650次阅读
    <b class='flag-5'>MySQL</b>的执行过程 SQL<b class='flag-5'>语句</b>性能<b class='flag-5'>优化</b>常用策略

    【工具分享】labview与MYsql语句使用判断

    语句执行1.写入MYSQL语句2.执行语句3.语句执行成功创建表格1.写入表格名与创建表格格式2.执行
    发表于 05-08 16:00

    begin ...... end 与 fork ...... join 语句的 区别 ------ 转载

    ; end_wave; //语句5,触发事件end_wave join并行块的执行特点为: 并行语句块内各条语句是各自独立地同时开始执行的,各条语句
    发表于 06-02 21:31

    MaxCompute JOIN优化小结

    join各种场景优化都做了一些梳理,现实情况很可能是上述多场景的组合,这时候就需要灵活运用相应的优化方法,举一反三。识别以下二维码,阅读更多干货
    发表于 03-15 13:22

    mysql的7种JOIN

    mysqlJOIN大汇总
    发表于 03-11 11:18

    mysql基本语句详细教程

    mysql基本语句详细教程
    发表于 12-15 22:15 0次下载

    Join在Spark是如何组织运行的

    ,我们有必要了解Join在Spark是如何组织运行的。 SparkSQL总体流程介绍 在阐述Join实现之前,我们首先简单介绍SparkSQL的总体流程,一般地,我们有两种方式使用SparkSQL
    的头像 发表于 09-25 11:35 2204次阅读
    <b class='flag-5'>Join</b>在Spark<b class='flag-5'>中</b>是如何组织运行的

    SystemVerilog的fork-join

    在fork-join语句,每个语句都是并发进程。在这个语句,父进程一直被阻塞,直到所有由
    的头像 发表于 12-09 11:58 2209次阅读

    应用层关联的优势 MySQL不推荐使用join的原因

    对于mysql,不推荐使用子查询和join是因为本身join的效率就是硬伤,一旦数据量很大效率就很难保证,强烈推荐分别根据索引单表取数据,然后在程序里面做join,merge数据。
    发表于 02-23 14:07 484次阅读

    mysql增删改查语句以及常用方法

    MySQL是一种热门的关系型数据库管理系统,广泛用于各种Web应用程序和企业级应用程序。本文将详细介绍MySQL的增删改查语句以及常用方
    的头像 发表于 11-16 15:36 1110次阅读

    mysql数据库的增删改查sql语句

    SQL语句,以帮助读者全面了解MySQL的基本操作。 一、增加数据 在MySQL数据库,我们可以使用INSERT语句来向表
    的头像 发表于 11-16 15:41 1223次阅读

    mysql数据库增删改查基本语句

    MySQL是一种关系型数据库管理系统,提供了丰富的功能和语法,来支持数据的增删改查。在本文中,将详细介绍MySQL数据库的增、删、改、查基本语句,以及一些常见用例。 一、数据的增加 在MySQ
    的头像 发表于 11-16 16:36 965次阅读

    mysql基础语句大全

    MySQL的基础语句可以分为以下几类: 数据库操作语句: 创建数据库:CREATE DATABASE database_name; 删除数据库:DROP DATABASE database_name
    的头像 发表于 11-16 16:42 1954次阅读

    MySQL常用语句

    ,包括创建和管理数据库、表、查询和修改数据等方面。 一、数据库的创建和管理 创建数据库 MySQL创建数据库的语句是CREATE DATABASE,语法如下: CREATE DATABASE
    的头像 发表于 11-21 11:11 510次阅读

    MySQL联表查询优化

    使用显示连接left join(right join,inner join),尽量避免隐式连接(where逗号连接表 .... and .... and ...)这类写法,假设三张表每张表有一千
    的头像 发表于 04-24 12:33 576次阅读
    <b class='flag-5'>MySQL</b>联表查询<b class='flag-5'>优化</b>