[转帖]MYSQL 数据库的合并表（可用于对多个分表进行操作） _MySQL, Oracle及数据库讨论区_Weblogic技术|Tuxedo技术|中间件技术|Oracle论坛|JAVA论坛|Linux/Unix技术|hadoop论坛

总帖数

每页帖数

1/1页

返回列表

发起投票

查看: 2877 | 回复: 0

主题： [转帖]MYSQL 数据库的合并表（可用于对多个分表进行操作）

ad222888

注册用户

等级：新兵
经验：66
发帖：134
精华：0
注册：2016-9-25
状态：离线
发送短消息息给ad222888

加好友发送短消息息给ad222888

发消息

发表于：

2019-8-29 10:54:15 | [全部帖] [楼主帖]

楼主

如果愿意的话，可以把合并表看成一种较老的、有更多限制的分区表，但是它们也有自己的用处，并且能提供一些分区表不能提供的功能。

合并表实际是容纳真正的表的容器。可以使用特殊的UNION语法来CREATE TABLE。下面是一个合并表的例子：

mysql> CREATE TABLE t1(a INT NOT NULL PRIMARY KEY)ENGINE=MyISAM;
mysql> CREATE TABLE t2(a INT NOT NULL PRIMARY KEY)ENGINE=MyISAM;
mysql> INSERT INTO t1(a) VALUES(1),(2);
mysql> INSERT INTO t2(a) VALUES(1),(2);
mysql> CREATE TABLE mrg(a INT NOT NULL PRIMARY KEY)
-> ENGINE=MERGE UNION=(t1, t2) INSERT_METHOD=LAST;
mysql> SELECT a FROM mrg;
+------+
|  a    |
+------+
|     1 |
|     1 |
|     2 |
|     2 |
+------+

注意到合并表包含的表列的数量和类型都是一样的，并且合并表上的索引也会在下属表上存在。这是创建合并表的要求。也要注意到在每个表的独有列上有主键，这会导致合并表有重复的行。这是合并表的一个局限：合并表内的每个表行为都很正常，但是它不会对下面的所有表进行强制约束。

INSERT_METHOD=LAST指令告诉MySQL把所有的INSERT语句都发送到合并表的最后一个表上。定义FIRST或LAST是控制插入数据位置的唯一方式（但是也可以直接插入到下属表中）。

分区表可以更多地控制数据存放的位置。

下面的INSERT语句对合并表和下属表都可见：

mysql> INSERT INTO mrg(a) VALUES(3);
mysql> SELECT a FROM t2;
+---+
| a |
+---+
| 1 |
| 2 |
| 3 |
+---+

合并表还有其他有趣的特性和限制，比如删除合并表或它的某个下属表。删除合并表让所有的"子表"都变得不可访问，但是删除其中的某个子表有不同的影响，它的行为和操作系统有关。例如，在GNU/Linux上，子表的文件描述符还保持开启的状态，并且表还继续存在，但是只能从合并表中访问。

mysql> DROP TABLE t1, t2;
mysql> SELECT a FROM mrg;
+------+
| a     |
+------+
|     1 |
|     1 |
|     2 |
|     2 |
|     3 |
+------+

还有一些另外的局限性和特殊行为。最好的办法是阅读手册，但是在这儿要说的是REPLACE并不能在所有的合并表上工作，并且AUTO_INCREMENT不会像你期望的那样工作。

合并表对性能的影响

MySQL对合并表的实现对性能有一些重要的影响。和其他MySQL特性一样，它在某些条件下性能会更好。下面是关于它的一些注意事项：

合并表比含有同样数据的非合并表需要更多的文件描述符。尽管合并表看上去是一个表，它实际是逐个打开了下属表。这样的结果就是单个表的缓存可以创建许多文件描述符。因此，即使已经配置了表的缓存，让服务器线程的文件描述符数量不要超过操作系统的限制，合并表仍然有可能导致超过这一限制。

创建合并表的CREATE语句不会检查下属表是否是兼容的。如果下属表的定义有轻微的不一样，MySQL会创建合并表，但是却无法使用。同样，如果在创建了一个有效的合并表之后对某个下属表进行了改变，它也会无法工作，并且会显示下面的错误信息："ERROR 1168（HY000）：无法打开定义不同的下属表，或者非MyISAM表，或者不存在的表"。

访问合并表的查询访问了每一个下属表。这也许会使单行键查找比单个表慢。在合并表中限制下属表是一个好主意，尤其是它是联接中的第二个或以后的表。每次操作访问的数据越少，那么访问每个表的开销相对于整个操作而言就越重要。下面是一些如何使用合并表的注意事项：

范围查找受访问所有下属表的开销的影响小于单个查找。

对索引表的表扫描和对单个表一样快。

一旦唯一键和主键查询成功，它们就立即停止。在这种情况下，服务器会挨个访问下属表，一旦查找到了值，就不会再查找更多的表。

下属表读取的顺序和CREAT TABLE语句中定义的一致。如果经常需要按照特定的顺序取得数据，可以利用这种特性使合并排序操作更快。

合并表的长处

合并表在处理数据方面既有积极的一面，也有消极的一面。经典的例子就是日志记录。日志是只追加的，所以可以每天用一个表。每天创建新的表并把它加入到合并表中。也可以把以前的表从合并表中移除掉，把它转化为压缩的MyISAM表，再把它们加回到合并表中。

这并不是合并表的唯一用途。它们通常都被用于数据仓库程序，因为它的另一个长处就是管理大量的数据。在实际中不太可能管理一个TB级别的表，但是如果是由单个50GB的表组成的合并表，任务就会简单很多。

当管理极其巨大的数据库时，考虑的绝不仅仅是常规操作。还要考虑崩溃与恢复。使用小表是很好的主意。检查和修复一系列的小表比起一个大表要快得多，尤其是大表和内存不匹配的时候。还可以并行地检查和修复多个小表。

数据仓库中另外一个顾虑就是如何清理掉老的数据。对巨型表使用DELETE语句最佳状况下效率不高，而在最坏情况下则是一场灾难。但是更改合并表的定义是很简单的，可以使用DROP TABLE命令删除老的数据。这可以轻易地实现自动化。

合并表并非只对日志和大量数据有效。它可以方便地按需创建繁忙的表。创建和删除合并表的代价是很低的。索引可以像对视图使用UNION ALL命令那样使用合并表。但它的开销更低，因为服务器不会把结果放到临时表中然后再传递给客户端。这使得它对于报告和仓库化数据非常有用。例如，要创建一个每晚都会运行的任务，它会把昨天的数据和8天前、15天前、以及之前的每一周的数据进行合并。使用合并表就可以创建无须修改的查询，并且自动地访问合适的数据。甚至还可以创建临时合并表，这是视图无法做到的。

因为合并表没有隐藏下属的MyISAM表，所以它提供了一些分区表无法提供的特性：

一个MyISAM表可以包含很多合并表。

可以通过拷贝.frm、.MYI、.MYD文件在服务器之间拷贝下属表。

可以轻易地把更多的表添加到合并表中。这只需要创建一个新表并且更改合并定义即可。

可以创建只包含想要的数据的临时合并表，例如某个特定时间段的数据。这是分区表无法做到的。

如果想对某个表进行备份、恢复、更改、修复，或者其他的操作，可以把它从合并表中移除，完成所有的工作之后再把它加回来。

可以使用myisampack压缩某些或所有的下属表。

分区表正好相反，MySQL隐藏了分区表的分区，并只能通过分区表访问所有的分区。

本版精华
热门帖子

操作引用/回复

总帖数

每页帖数

1/1页

返回列表

用户登录

Weblogic中间件技术论坛

Tuxedo中间件技术论坛

数据库论坛

Java论坛

Linux/unix论坛

网站地图