MySQL性能优化之char、varchar、text的区别

阳光穿透心脏的1/2处 2022-12-17 01:22 557阅读 0赞

参考:https://dev.mysql.com/doc/refman/8.0/en/string-type-overview.html

  1. 在存储字符串时, 可以使用charvarchar或者text类型, 那么具体使用场景呢?
  2. 参考下面这个表结构:

Center

Center 1

Center 2

1、 char长度固定, 即每条数据占用等长字节空间;适合用在身份证号码、手机号码等定。

2、 varchar可变长度,可以设置最大长度;适合用在长度可变的属性。

3、 text不设置长度, 当不知道属性的最大长度时,适合用text。

按照查询速度: char最快, varchar次之,text最慢。

char:char(n)中的n表示字符数,最大长度是255个字符; 如果是utf8编码方式, 那么char类型占255 * 3个字节。(utf8下一个字符占用1至3个字节)

varchar:varchar(n)中的n表示字符数,最大空间是65535个字节, 存放字符数量跟字符集有关系;

  1. MySQL5.0.3以前版本varchar(n)中的n表示字节数;
  2. MySQL5.0.3以后版本varchar(n)中的n表示字符数;

Center 3

PS:varchar实际范围是65532或65533, 因为内容头部会占用1或2个字节保存该字符串的长度;如果字段default null(即默认值为空),整条记录还需要1个字节保存默认值null。

  1. 如果是utf8编码, 那么varchar最多存65532/3 = 21844个字符。

text:

Center 4

跟varchar基本相同, 理论上最多保存65535个字符, 实际上text占用内存空间最大也是65535个字节; 考虑到字符编码方式, 一个字符占用多个字节, text并不能存放那么多字符; 跟varchar的区别是text需要2个字节空间记录字段的总字节数。

PS: 由于varchar查询速度更快, 能用varchar的时候就不用text。

最近有几个同学问我varchar和text有啥别吗,这个问题,以前说真的也没太多的整理,以前遇到text在设计中就是尽可能的拆到另一个表中,保持主表尽量的瘦小,可以让innodb bp缓存更多的数据。

今天借次机会系统整理一下,主要从存储上,最大值,默认值几个方面进行比较。

BTW: 从ISO SQL:2003上讲VARCHAR是一个标准型,但TEXT不是(包括tinytext).varchar在MySQL 5.0.3之前只支持0-255byte, 在5.0.3之后才支持到0-65535byte.

从存储上讲:

  1. - text 是要要进overflow存储。 也是对于text字段,不会和行数据存在一起。但原则上不会全部overflow ,
  2. 会有768字节和原始的行存储在一块,多于768的行会存在和行相同的Page或是其它Page上。
  3. - varchar MySQL内部属于从blob发展出来的一个结构,在早期版本中innobase中,也是768字节以后进行overfolw存储。
  4. - 对于Innodb-plugin后: 对于变长字段处理都是20Byte后进行overflow存储
  5. (在新的row_format下:dynimic compress

说完存储后,说一下使用这些大的变长字段的缺点:

  1. - Innobase中,变长字段,是尽可能的存储到一个Page里,这样,如果使用到这些大的变长字段,会造成一个Page里能容纳的行
  2. 数很少,在查询时,虽然没查询这些大的字段,但也会加载到innodb buffer pool中,等于浪费的内存。
  3. buffer pool 的缓存是按page为单位)(不在一个page了会增加随机的IO
  4. - innodb-plugin中为了减少这种大的变长字段对内存的浪费,引入了大于20个字节的,都进行overflow存储,
  5. 而且希望不要存到相同的page中,为了增加一个page里能存储更多的行,提高buffer pool的利用率。 这也要求我们,
  6. 如果不是特别需要就不要读取那些变长的字段。

那问题来了? 为什么varchar(255+)存储上和text很相似了,但为什么还要有varchar, mediumtext, text这些类型?
(从存储上来讲大于255的varchar可以说是转换成了text.这也是为什么varchar大于65535了会转成mediumtext)

我理解:这块是一方面的兼容,另一方面在非空的默认值上varchar和text有区别。从整体上看功能上还是差别的。

这里还涉及到字段额外开销的:

  1. - varchar 小于255byte 1byte overhead
  2. - varchar 大于255byte 2byte overhead
  3. - tinytext 0-255 1 byte overhead
  4. - text 0-65535 byte 2 byte overhead
  5. - mediumtext 0-16M 3 byte overhead
  6. - longtext 0-4Gb 4byte overhead

备注 overhead是指需要几个字节用于记录该字段的实际长度。

从处理形态上来讲varchar 大于768字节后,实质上存储和text差别不是太大了。 基本认为是一样的。
另外从8000byte这个点说明一下: 对于varcahr, text如果行不超过8000byte(大约的数,innodb data page的一半) ,overflow不会存到别的page中。基于上面的特性可以总结为text只是一个MySQL扩展出来的特殊语法有兼容的感觉。

默认值问题:

  1. - 对于text字段,MySQL不允许有默认值。
  2. - varchar允许有默认值

总结:

  1. 根据存储的实现: 可以考虑用varchar替代tinytext
  2. 如果需要非空的默认值,就必须使用varchar
  3. 如果存储的数据大于64K,就必须使用到mediumtext , longtext
  4. varchar(255+)和text在存储机制是一样的
  5. 需要特别注意varchar(255)不只是255byte ,实质上有可能占用的更多。
  6. 特别注意,varchar大字段一样的会降低性能,所以在设计中还是一个原则大字段要拆出去,主表还是要尽量的瘦小

发表评论

表情:
评论列表 (有 0 条评论,557人围观)

还没有评论,来说两句吧...

相关阅读

    相关 mysql数据库性能优化

    一、架构设计层面优化。 MySQL是一个磁盘IO访问非常频繁的关系型数据库,在高并发和高性能的场景中,MySQL数据库必然会承受巨大的并发压力。在此时,我们优化的方式主要可以