0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

MySQL中varchar(n) 中 n 最大取值为多少?

小林coding 来源:小林coding 作者:小林coding 2022-12-05 14:07 次阅读

大家好,我是小林。

上周发了一篇字节一面:MySQL 的 NULL 值是怎么存放的?,文章里面有提及这个问题:「varchar(n) 中 n 最大取值为多少?」

当时这部分内容写的不够严谨,所以我重写了这部分内容。

所以,这次就聊聊这个问题。

前置知识

要回答这个问题,首先我们得先知道 MySQL 存储一条记录的格式长什么样子。

以 Compact 行格式作为例子,它长这样:

de167c0c-7460-11ed-8abf-dac502259ad0.png

可以看到,一条完整的记录分为「记录的额外信息」和「记录的真实数据」两个部分。

这里重点讲讲记录的额外信息,它包含 3 个部分:变长字段长度列表、NULL 值列表、记录头信息。

  • 变长字段长度列表

用于存储一行记录中每个变长字段的长度。

「变长字段长度列表」所占用的字节数 = 所有「变长字段长度」占用的字节数之和。

举个例子,假设数据库表中有 2 个 varchar(10) 类型的字段,分别为 a 和 b,且数据库表的字符集为 ascii 字符集(1 个字符占用 1 字节)。

那么a和b字段的数据值的长度分别只需要用1字节表示就行了,因为1字节能表示最大的字节数是 255,而 varchar(10) 类型的字段最大允许存储的字节数是 10 字节,所以只需要用 1 字节表示变长字段的长度就行。

那么这种情况下的 「变长字段长度列表」所占用的字节数 = 1 字节 + 1字节 = 2 字节。

「变长字段长度列表」不是必须的,如果数据库表没有变长字段,比如字段类型都是int,那么行格式中就不需要「变长字段长度列表」。

  • NULL 值列表

用于标记一行记录中字段值为 NULL 的字段,二进制位的值为 1 时,代表该字段的值为NULL,二进制位的值为 0 时,代表该字段的值不为 NULL。

另外,NULL 值列表必须用整数个字节的位表示(1字节8位),如果使用的二进制位个数不足整数个字节,则在字节的高位补 0

如果表中允许为 NULL 值的记录的个数小于等于 8 个,那么 NULL 值列表就会用 1 字节表示。

如果如果表中允许为 NULL 值的记录的个数大于8 并且小于等于 16,那么 NULL 值列表就会用 2 字节表示,以此类推。

因此,如果表中有字段允许为NULL,那么NULL 值列表」至少占用 1 字节空间。

NULL 值列表不是必须的,如果数据库表中的字段都定义成NOT NULL,那么行格式中就不需要NULL 值列表」。

  • 记录头信息

记录头信息中包含的内容很多,比如记录的删除标记位,指向下一条记录的指针等等,不是本文问题的重点,所以我就不细讲了。

varchar(n) 中 n 最大取值为多少?

我们要清楚一点,MySQL 规定除了 TEXT、BLOBs 这种大对象类型之外,其他所有的列(不包括隐藏列和记录头信息)占用的字节长度加起来不能超过 65535 个字节

也就是说,一行记录除了 TEXT、BLOBs 类型的列,限制最大为 65535 字节,注意是一行的总长度,不是一列

知道了这个前提之后,我们再来看看这个问题:「varchar(n) 中 n 最大取值为多少?」

varchar(n) 字段类型的 n 代表的是最多存储的字符数量,并不是字节大小哦。

要算 varchar(n) 最大能允许存储的字节数,还要看数据库表的字符集,因为字符集代表着,1个字符要占用多少字节。

比如 ascii 字符集, 1 个字符占用 1 字节,那么 varchar(100) 意味着最大能允许存储 100 字节的数据。

单字段的情况

前面我们知道了,一行记录最大只能存储 65535 字节的数据。

那假设数据库表只有一个 varchar(n) 类型的列且字符集是 ascii,在这种情况下, varchar(n) 中 n 最大取值是 65535 吗?

不着急说结论,我们先来做个实验验证一下。

我们定义一个 varchar(65535) 类型的字段,字符集为 ascii 的数据库表。

CREATETABLEtest(
`name`VARCHAR(65535)NULL
)ENGINE=InnoDBDEFAULTCHARACTERSET=asciiROW_FORMAT=COMPACT;

看能不能成功创建一张表:

de2baa1e-7460-11ed-8abf-dac502259ad0.png

结果显示,创建失败了。

从报错信息就可以知道一行数据的最大字节数是 65535(不包含 TEXT、BLOBs 这种大对象类型),其中包含了 storage overhead

问题来了,这个 storage overhead 是什么呢?其实就是「变长字段长度列表」和 「NULL 值列表」。

也就是说一行数据的最大字节数 65535,其实是包含「变长字段长度列表」和 「NULL 值列表」所占用的字节数的

所以, 我们在算 varchar(n) 中 n 最大值时,需要减去 storage overhead 占用的字节数。

这是因为我们存储字段类型为 varchar(n) 的数据时,其实分成了三个部分来存储:

  • 真实数据
  • 真实数据占用的字节数
  • NULL 标识,如果不允许为NULL,这部分不需要

本次案例中,「NULL 值列表」所占用的字节数是多少?

前面我创建表的时候,字段是允许为 NULL 的,所以会用 1 字节来表示「NULL 值列表」

本次案例中,「变长字段长度列表」所占用的字节数是多少?

「变长字段长度列表」所占用的字节数 = 所有「变长字段长度」占用的字节数之和。

所以,我们要先知道每个变长字段的「变长字段长度」需要用多少字节表示?具体情况分为:

  • 条件一:如果变长字段允许存储的最大字节数小于等于 255 字节,就会用 1 字节表示「变长字段长度」;
  • 条件二:如果变长字段允许存储的最大字节数大于 255 字节,就会用 2 字节表示「变长字段长度」;

我们这里字段类型是 varchar(65535) ,字符集是 ascii,所以代表着变长字段允许存储的最大字节数是 65535,符合条件二,所以会用 2 字节来表示「变长字段长度」。

因为我们这个案例是只有 1 个变长字段,所以「变长字段长度列表」= 1 个「变长字段长度」占用的字节数,也就是 2 字节

因为我们在算 varchar(n) 中 n 最大值时,需要减去 「变长字段长度列表」和 「NULL 值列表」所占用的字节数的。

所以,在数据库表只有一个 varchar(n) 字段且字符集是 ascii 的情况下,varchar(n) 中 n 最大值 = 65535 - 2 - 1 = 65532

我们先来测试看看 varchar(65533) 是否可行?

de3ec586-7460-11ed-8abf-dac502259ad0.png

可以看到,还是不行,接下来看看 varchar(65532) 是否可行?

de6852e8-7460-11ed-8abf-dac502259ad0.png

可以看到,创建成功了。说明我们的推论是正确的,在算 varchar(n) 中 n 最大值时,需要减去 「变长字段长度列表」和 「NULL 值列表」所占用的字节数的。

当然,我上面这个例子是针对字符集为 ascii 情况,如果采用的是 UTF-8,varchar(n) 最多能存储的数据计算方式就不一样了:

  • 在 UTF-8 字符集下,一个字符串最多需要三个字节,varchar(n) 的 n 最大取值就是 65532/3 = 21844。

上面所说的只是针对于一个字段的计算方式。

多字段的情况

如果有多个字段的话,要保证所有字段的长度 + 变长字段字节数列表所占用的字节数 + NULL值列表所占用的字节数 <= 65535

这里举个多字段的情况的例子。

e05a3850-7460-11ed-8abf-dac502259ad0.png

实验结果:

e08846c8-7460-11ed-8abf-dac502259ad0.png

总结

varchar(n) 中 n 最大取值为多少?

一行记录最大能存储 65535 字节的数据,但是这个是包含「变长字段字节数列表所占用的字节数」和「NULL值列表所占用的字节数」。所以, 我们在算 varchar(n) 中 n 最大值时,需要减去这两个列表所占用的字节数。

如果一张表只有一个 varchar(n) 字段,且允许为 NULL,字符集为 ascii。varchar(n) 中 n 最大取值为 65532。

计算公式:65535 - 变长字段字节数列表所占用的字节数- NULL值列表所占用的字节数 = 65535 - 2 - 1 = 65532。

如果有多个字段的话,要保证所有字段的长度 + 变长字段字节数列表所占用的字节数 + NULL值列表所占用的字节数 <= 65535。


历史好文:

字节一面:HTTP 长连接和 TCP 长连接有区别?

美团三面:一直追问我, MySQL 幻读被彻底解决了吗?

保姆级教程!2 万字 + 30 张图搞懂 MySQL 是怎么加行级锁的?

MySQL 全局锁、表级锁、行级锁,你搞清楚了吗?


审核编辑 :李倩


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    6853

    浏览量

    88769
  • MySQL
    +关注

    关注

    1

    文章

    799

    浏览量

    26413

原文标题:面试官:MySQL 中 varchar(n) 中 n 最大取值为多少?

文章出处:【微信号:小林coding,微信公众号:小林coding】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    80211N连不上

    802.11n是一种无线传输标准,旨在提供高速无线网络连接。它通过使用MIMO(多输入多输出)技术和更宽的频带宽度来提高数据传输速率和信号质量。 然而,在使用过程可能会遇到连接问题,这些问题可能由
    发表于 08-24 14:17

    差分运放电路反馈电容如何取值

    如图示电路红圈电容C2/C4改如何取值,有没有哪位能提供详细的讲解资料。谢谢
    发表于 08-20 08:10

    IG902如何上传数据到MQTT云平台EMQX ?

    监控-》设备列表右上角操作的“ ”号添加设备。 3)添加变量 2.模拟传感器数据上传: 1)使用软件modbus Slave 2) 添加模拟数据 3)启动数据发送
    发表于 07-25 07:09

    有关LM3914N和LM3914N-1应用的疑问

    据手册,LM3914N-1的封装形式按NS叫法NA18A,LM3914N的封装形式按NS叫法N
    发表于 04-28 11:36

    许继电气WGB-110N120N130N140N150N160N170N七大系列微机保护测控装置更换

    许继电气的WGB-100N系列保护装置分七大系列,分别是:WGB-110N系列微机线路保护装置、WGB-120N系列微机高压柜综合保护装置、WGB-130N系列微机厂用变保护装置、WG
    的头像 发表于 04-14 11:53 658次阅读

    labview 创建mysql 表时 设置时间 怎么在mysql是格式是date 而不是datetime?

    选择 时间日期 但是在mysql是date而不是datetime类型 ,除了sql语句创建表 ,怎么能实现创建表数据datetime类型
    发表于 02-04 09:46

    电流滤波器N/L/C的含义

    电流滤波器通常用于消除电路的高频噪声和波动,以确保电流的稳定和可靠。在电流滤波器,经常会出现N、L、C等标识,它们分别代表着不同的意思。
    的头像 发表于 12-28 18:10 1027次阅读

    ne556n功放保护电路原理

    NE556N功放保护电路的原理,包括过载保护、过热保护、短路保护等方面。 过载保护 过载保护是NE556N功放保护电路的重要组成部分。当功放电路的输出电流超过其最大额定值时,过载保护电路会立即动作,切断电源以防止电路损坏。 在N
    的头像 发表于 12-14 16:43 3743次阅读

    java的switch语句 case的取值

    Java的switch语句是一种用于多重条件判断的语句,用于根据不同的条件执行不同的代码块。在switch语句中,case关键字用来指定不同的取值。 在Java,switch语句的语法结构如下
    的头像 发表于 11-30 16:05 1046次阅读

    mysqldecimal的用法

    MySQL的DECIMAL是用于存储精确数值的数据类型。DECIMAL可以存储固定精度和小数位数的值。在MySQL,DECIMAL数据类型有两个参数:精度和小数位数。精度指的是数字
    的头像 发表于 11-30 10:45 1014次阅读

    mysqlreplace的用法

    MySQL,REPLACE是用于替换字符串或者更新特定记录的关键字。它可以用于单个表或者多个表,允许你在已有的数据查找指定的字符串并替换为新的字符串。REPLACE非常强大,可以根据你的需求
    的头像 发表于 11-30 10:35 1693次阅读

    python 排列组合c(m,n)怎么算

    排列组合是数学的一个概念,用于计算从集合中选择一定数量元素进行排列或组合的方法数。其中,C(m, n)表示从m个元素中选择n个元素进行排列组合的方法数。 在Python,可以使用标
    的头像 发表于 11-29 16:36 1973次阅读

    MySQL导出的步骤

    MySQL是一种常用的关系型数据库管理系统,用于存储和管理大量的结构化数据。在实际应用,我们经常需要将MySQL数据库的数据导出到其他地方,如备份数据、数据迁移、数据分析等。下面是
    的头像 发表于 11-21 10:58 747次阅读

    CLOB类型的数据转换为VARCHAR类型

    在数据库,CLOB(Character Large Object)和VARCHAR(Variable Character)都是用来存储字符类型数据的字段。CLOB字段适用于存储大量的字符数据,而
    的头像 发表于 11-21 10:39 5293次阅读

    clob类型转varchar方法

    将CLOB类型的数据转换为VARCHAR类型,以满足特定的需求或调整数据库设计。 在Oracle数据库,CLOB类型是一个特殊的字符数据类型,可以存储大于4000个字符的文本数据。在某些情况下,我们可能希望将CLOB类型的数据转换为V
    的头像 发表于 11-21 10:33 6448次阅读