MySQL数据库varchar与text说不清的那些事_MySQL, Oracle及数据库讨论区_Weblogic技术|Tuxedo技术|中间件技术|Oracle论坛|JAVA论坛|Linux/Unix技术|hadoop论坛

总帖数

每页帖数

1/1页

返回列表

发起投票

查看: 2953 | 回复: 0

主题： MySQL数据库varchar与text说不清的那些事

tngou

注册用户

等级：中校
经验：2433
发帖：192
精华：15
注册：2014-4-28
状态：离线
发送短消息息给tngou

加好友发送短消息息给tngou

发消息

发表于：

2015-4-30 12:42:31 | [全部帖] [楼主帖]

楼主

varchar和text有啥别吗？这个问题，以前说真的也没太多的整理，以前遇到text在设计中就是尽可能的拆到另一个表中，保持主表尽量的瘦小，可以让innodb bp缓存更多的数据。

今天借次机会系统整理一下，主要从存储上，最大值，默认值几个方面进行比较。

BTW：从ISO SQL:2003上讲VARCHAR是一个标准型，但TEXT不是（包括tinytext）.varchar在MySQL 5.0.3之前只支持0-255byte, 在5.0.3之后才支持到0-65535byte.

从存储上讲：

- text 是要要进overflow存储。也是对于text字段，不会和行数据存在一起。但原则上不会全部overflow , 会有768字节和原始的行存储在一块，多于768的行会存在和行相同的Page或是其它Page上。 - varchar 在MySQL内部属于从blob发展出来的一个结构，在早期版本中innobase中，也是768字节以后进行overfolw存储。 - 对于Innodb-plugin后：对于变长字段处理都是20Byte后进行overflow存储（在新的row_format下：dynimic compress）

1
2
3
4
5
6
7
8

- text 是要要进overflow存储。也是对于text字段，不会和行数据存在一起。但原则上不会全部overflow ,

会有768字节和原始的行存储在一块，多于768的行会存在和行相同的Page或是其它Page上。

- varchar 在MySQL内部属于从blob发展出来的一个结构，在早期版本中innobase中，也是768字节以后进行overfolw存储。

- 对于Innodb-plugin后：对于变长字段处理都是20Byte后进行overflow存储

（在新的row_format下：dynimic compress）

说完存储后，说一下使用这些大的变长字段的缺点：

- 在Innobase中,变长字段，是尽可能的存储到一个Page里，这样，如果使用到这些大的变长字段，会造成一个Page里能容纳的行数很少，在查询时，虽然没查询这些大的字段，但也会加载到innodb buffer pool中，等于浪费的内存。（buffer pool 的缓存是按page为单位）（不在一个page了会增加随机的IO） - 在innodb-plugin中为了减少这种大的变长字段对内存的浪费，引入了大于20个字节的，都进行overflow存储，而且希望不要存到相同的page中，为了增加一个page里能存储更多的行，提高buffer pool的利用率。这也要求我们，如果不是特别需要就不要读取那些变长的字段。

1
2
3
4
5
6
7
8

- 在Innobase中,变长字段，是尽可能的存储到一个Page里，这样，如果使用到这些大的变长字段，会造成一个Page里能容纳的行

数很少，在查询时，虽然没查询这些大的字段，但也会加载到innodb buffer pool中，等于浪费的内存。

（buffer pool 的缓存是按page为单位）（不在一个page了会增加随机的IO）

- 在innodb-plugin中为了减少这种大的变长字段对内存的浪费，引入了大于20个字节的，都进行overflow存储，

而且希望不要存到相同的page中，为了增加一个page里能存储更多的行，提高buffer pool的利用率。这也要求我们，

如果不是特别需要就不要读取那些变长的字段。

那问题来了？为什么varchar(255+)存储上和text很相似了，但为什么还要有varchar, mediumtext, text这些类型？
（从存储上来讲大于255的varchar可以说是转换成了text.这也是为什么varchar大于65535了会转成mediumtext)

我理解：这块是一方面的兼容，另一方面在非空的默认值上varchar和text有区别。从整体上看功能上还是差别的。

这里还涉及到字段额外开销的：

- varchar 小于255byte 1byte overhead - varchar 大于255byte 2byte overhead - tinytext 0-255 1 byte overhead - text 0-65535 byte 2 byte overhead - mediumtext 0-16M 3 byte overhead - longtext 0-4Gb 4byte overhead

- varchar 小于255byte 1byte overhead

- varchar 大于255byte 2byte overhead

- tinytext 0-255 1 byte overhead

- text 0-65535 byte 2 byte overhead

- mediumtext 0-16M 3 byte overhead

- longtext 0-4Gb 4byte overhead

备注 overhead是指需要几个字节用于记录该字段的实际长度。

从处理形态上来讲varchar 大于768字节后，实质上存储和text差别不是太大了。基本认为是一样的。
另外从8000byte这个点说明一下：对于varcahr, text如果行不超过8000byte（大约的数，innodb data page的一半） ,overflow不会存到别的page中。基于上面的特性可以总结为text只是一个MySQL扩展出来的特殊语法有兼容的感觉。

默认值问题：

- 对于text字段，MySQL不允许有默认值。 - varchar允许有默认值

- 对于text字段，MySQL不允许有默认值。

- varchar允许有默认值

总结：

根据存储的实现：可以考虑用varchar替代tinytext 如果需要非空的默认值，就必须使用varchar 如果存储的数据大于64K，就必须使用到mediumtext , longtext varchar(255+)和text在存储机制是一样的需要特别注意varchar(255)不只是255byte ,实质上有可能占用的更多。特别注意，varchar大字段一样的会降低性能，所以在设计中还是一个原则大字段要拆出去，主表还是要尽量的瘦小

根据存储的实现：可以考虑用varchar替代tinytext

如果需要非空的默认值，就必须使用varchar

如果存储的数据大于64K，就必须使用到mediumtext , longtext

varchar(255+)和text在存储机制是一样的

需要特别注意varchar(255)不只是255byte ,实质上有可能占用的更多。

特别注意，varchar大字段一样的会降低性能，所以在设计中还是一个原则大字段要拆出去，主表还是要尽量的瘦小

源码中类型：

本版精华
热门帖子

操作引用/回复

总帖数

每页帖数

1/1页

返回列表

用户登录

Weblogic中间件技术论坛

Tuxedo中间件技术论坛

数据库论坛

Java论坛

Linux/unix论坛

网站地图