MySQL数据库utf8_unicode_ci与utf8_general_ci编码的区别_MySQL, Oracle及数据库讨论区_Weblogic技术|Tuxedo技术|中间件技术|Oracle论坛|JAVA论坛|Linux/Unix技术|hadoop论坛

总帖数

每页帖数

1/1页

返回列表

发起投票

查看: 3614 | 回复: 0

主题： MySQL数据库utf8_unicode_ci与utf8_general_ci编码的区别

tngou

注册用户

等级：中校
经验：2433
发帖：192
精华：15
注册：2014-4-28
状态：离线
发送短消息息给tngou

加好友发送短消息息给tngou

发消息

发表于：

2014-12-3 17:13:44 | [全部帖] [楼主帖]

楼主

在创建数据库表时，我们经常用UTF-8作为数据库编码，而在utf8_unicode_ci与utf8_general_ci选择又是一个疑问？

那么在选择前我们先来了解一下utf8_unicode_ci与utf8_general_ci。

utf8_general_ci ： Unicode (多语言), 不区分大小写

utf8_unicode_ci： Unicode (多语言), 不区分大小写

这里有什么区别呀，都是一样的，那么我们看看另外一个编码。

utf8_bin ：Unicode (多语言), 二进制（区分大小写）

也许这里就比较好区分了，但utf8_unicode_ci与utf8_general_ci？

当前，utf8_unicode_ci校对规则仅部分支持Unicode校对规则算法，一些字符还是不能支持。

并且，不能完全支持组合的记号。这主要影响越南和俄罗斯的一些少数民族语言，如：Udmurt 、Tatar、Bashkir和Mari。

utf8_unicode_ci 的最主要的特色是支持扩展，即当把一个字母看作与其它字母组合相等时。例如，在德语和一些其它语言中‘ß’等于‘ss’。

utf8_general_ci 是一个遗留的校对规则，不支持扩展。它仅能够在字符之间进行逐个比较。这意味着utf8_general_ci校对规则进行的比较速度很快，

但是与使用utf8_unicode_ci的校对规则相比，比较正确性较差）。

例如，使用utf8_general_ci和utf8_unicode_ci两种校对规则下面的比较相等：

Ä = A
Ö = O
Ü = U

两种校对规则之间的区别是，对于utf8_general_ci下面的等式成立：

ß = s

但是，对于utf8_unicode_ci下面等式成立：

ß = ss

对于一种语言仅当使用utf8_unicode_ci排序做的不好时，才执行与具体语言相关的utf8字符集校对规则。例如，对于德语和法语，utf8_unicode_ci工作的很好，因此不再需要为这两种语言创建特殊的utf8校对规则。

utf8_general_ci也适用与德语和法语，除了‘ß’等于‘s’，而不是‘ss’之外。

如果你的应用能够接受这些，那么应该使用utf8_general_ci，因为它速度快。否则，使用utf8_unicode_ci，因为它比较准确。

该贴由hui.chen转至本版2014-12-10 16:02:41

本版精华
热门帖子

操作引用/回复

总帖数

每页帖数

1/1页

返回列表

用户登录

Weblogic中间件技术论坛

Tuxedo中间件技术论坛

数据库论坛

Java论坛

Linux/unix论坛

网站地图