MySQL 的 utf8_general_ci 和 utf8_unicode_ci 有什么区别，应如何选择？

xiaobaif 2020-01-09

首先就其准确性说，这世界上有无数种文字，除了通用的英文使用我们较熟悉的 A-Z 字符外，还有很多种近似的写法用于法文、德文、俄文等等…

MySQL 的 utf8_general_ci 和 utf8_unicode_ci 有什么区别，应如何选择？

光是一个 A 字就有数十种不同表现
为什么不都用同一种 A 呢，几十种多麻烦啊。事实上，它们在所属的文字上都各有意义，可能代表不同的发音，也可能是其他东西。在某些语言上，同一个单词不同发音可能就代表两个意思。

校对规则

utf8_unicode_ci 及 utf8_general_ci 的用途就是对那些看起来不一样的字符进行转换，令我们进行排序比对时更方便准确。

以下面为例，直接看起来是不相等的，但在实际应用上是成立的，这就是 utf8_unicode_ci 及 utf8_general_ci 工作的结果。
Ä = A
Ö = O
Ü = U

而 utf8_unicode_ci 准确性较好就表现在它有更完整的字元对照表上，它甚至可以将一个特别字符转换成多于一个英文字符，以德文中的 s 例:

在 utf8_unicode_ci 下面等式是成立
ß = ss

在 utf8_general_ci 只有这样才成立
ß = s

排序规则

因为 utf8_unicode_ci 有更完整字符表及转换规则，所以在排序的准确性上也比 utf8_general_ci 高一些。

utf8_general_ci 字符表的一部份

utf8_unicode_ci 有更完整的字符表

效能

同样因为 utf8_unicode_ci 的字符表及转换规则更复杂，所以在效能上比 utf8_general_ci 慢。

总结

如果你的应用是德文、俄文等等，或者需要精确处理国际化的内容，请用 utf8_unicode_ci 。
否则的话用 utf8_general_ci 就可以了。

备注

虽然说 utf8_unicode_ci 的字集比较完整，但其实还是不全的，所以 MySQL 还提供了很多种其他语言的专用字集，用于特别的本地应用，详细可以看看下面的官网连结

參考

MySQL 官方解说: http://dev.mysql.com/doc/refman/5.0/en/charset-unicode-sets.html

: xiaobaif

相关推荐

PHP dirname(FILE)原理及用法解析

即使这个文件被其他文件引用，__file__始终是它所在文件的完整路径，而不是引用它的那个文件完整路径。dirname;得到的是__FILE__所在文件的上一层目录名。_FILE_ 得到的就是完整路径即 F:\Modoer_2.6_SC_UTF8\upl

wwwsurfphpseocom 0喜欢 / 2评论 2020-10-28

使用AJAX实现UTF8编码表单提交到GBK编码脚本无乱码的解决方法

<li><a href="utf8Form.html" rel="external nofollow" rel="external nofollow" rel="ext

learningever 0喜欢 / 0评论 2020-09-19

Golang 中的 Unicode 与 UTF-8

大多数的我们，真正认识到有字符编码这回事，一般都是因为遇到了乱码，因为我国常用的编码是 GBK 以及 GB2312：用两个 Byte 来表示所有的汉字，这样，我们一共可以表示 2^16 = 65536 个字符，一旦我们的 GBK 以及 GB2312 编

周游列国之仕子 0喜欢 / 0评论 2020-09-21

JVM系列之:String.intern和stringTable

它和String.intern有什么关系呢？在字符串对象的创建过程中，StringTable有起到了什么作用呢？一切的答案都在本文中，快来看看吧。intern是String类中的一个native方法，所以它底层是用c++来实现的。感兴趣的同学可以去查看下J

voiletbin 0喜欢 / 0评论 2020-07-26

mysql URL

characterEncoding=utf8&useUnicode=true. characterEncoding=utf8&useSSL=false&serverTimezone=UTC

ldcwang 0喜欢 / 0评论 2020-07-26

MySQL 编码utf8 与 utf8mb4 utf8mb4_unicode_ci 与 utf8mb4_general_ci

utf8mb4 已成为 MySQL 8.0 的默认字符集，在MySQL 8.0.1及更高版本中将 utf8mb4_0900_ai_ci 作为默认排序规则。UTF-8 编码是一种变长的编码机制，可以用1~4个字节存储字符。因为历史遗留问题，MySQL 中的

mjshldcsd 0喜欢 / 0评论 2020-06-14

Oracle 修改字符集（AL32UTF8 转换成UTF8字符集）

warden00 0喜欢 / 0评论 2020-06-11

PHP无法连接MYSQL8.0一般处理办法

修改默认加密方式，默认编码

勇往直前 0喜欢 / 0评论 2020-06-04

windows系统修改cmd窗口utf-8编码格式

window操作系统默认编码格式是gbk编码，下面教大家如何临时修改成utf-8编码和永久默认为utf-8编码格式。直接输入“chcp 65001”，回车键执行，这时候该窗口编码已经是UTF-8编码了。按顺序找到HKEY_LOCAL_MACHINE\SOF

88236637 0喜欢 / 0评论 2020-06-03

mysql多个字段模糊查询是否包含某个词

) COLLATE utf8_general_ci LIKE ‘%替换关键词%‘;

weiguoxin 0喜欢 / 0评论 2020-06-02

ascii、unicode、utf-8、gbk

字节码是一种中间状态（中间码）的二进制代码（文件）。需要直译器转译后才能成为机器码。1字节 = 8 位位，数据存储是以“字节”为单位，数据传输是以大多是以“位”为单位，一个位就代表一个0或1，二进制是构成存储器的最小单位，utf-8 万国码的升级版

81214051 0喜欢 / 0评论 2020-06-01

Mysql 常用语句实战（2）

`Cno` int NOT NULL COMMENT ‘课程编号‘,) ENGINE = InnoDB CHARACTER SET = utf8 COLLATE = utf8_general_ci ROW_FORMAT = Compact;`score`

阳历六月 0喜欢 / 0评论 2020-05-14

Mysql创建数据库字符集的选择

utf8_general_ci ，这个你在注册用户名和邮箱的时候就要使用。utf8_bin:字符串每个字符串用编译存储。utf8_unicode_ci和utf8_general_ci对中、英文来说没有实质的差别。

bluet00 0喜欢 / 0评论 2020-05-12

hibernate连接数据库中文乱码

useUnicode=true&characterEncoding=utf8，不然会出现编译错误，错误提示为将&连接符改为;。设置这些之后乱码问题就解决了。

wintershii 0喜欢 / 0评论 2020-04-21

Spring Boot 整合 Shiro 实现登录认证与权限控制

`perm_id` int NOT NULL COMMENT ‘权限主键‘,`perm_description` varchar CHARACTER SET utf8 COLLATE utf8_bin DEFAULT NULL COMMENT ‘权限描述‘

luckyxl0 0喜欢 / 0评论 2020-04-19

Mysql的分页查询优化

`id` varchar CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL DEFAULT ‘‘,`TVSerialNumber` varchar CHARACTER SET utf8 COLLATE

MissFuTT 0喜欢 / 0评论 2020-04-15

utf8字符集下的比较规则

在MySQL中，比较常用的字符集是utf8和utf8mb4。这两个字符集是类似的，utf8是utf8mb3的别名，所以之后在MySQL中提到utf8就意味着使用1~3个字节来表示一个字符，如果大家有使用4字节编码一个字符的情况，比如存储一些emoji表情啥

88384957 0喜欢 / 0评论 2020-03-27

MariaDB 10.4.12 Stable 绿色版下载安装

打开D:\db\my.ini文件，做下面的编辑后，保存。

hanshangzhi 0喜欢 / 0评论 2020-03-05

数据库的增删改查

CREATE DATABASE IF NOT EXISTS scott CHARSET UTF8;CREATE DATABASE IF NOT EXISTS scott CHARACTER SET UTF8;CREATE DATABASE scott CH

airfling 0喜欢 / 0评论 2020-02-22

DOS命令行窗口mysql中文显示乱码问题解决方法

MySQL的默认编码是Latin1，不支持中文，如何修改MySQL的默认编码呢，下面以 gbk为例来说明。或者在cmd中敲入net stop mysql ,mysql> status;--------------mysql Ver 14.14 Di

cyhgogogo 0喜欢 / 0评论 2020-02-19

MySQL 查询不区分大小写的问题以及编码格式问题

最近，在用SSH框架完成一个实践项目时，碰到了一个莫名其妙的Bug困扰了我好久，最后终于解决，记录如下。用上面的两条sql语句分表查询，出来的结果居然是一样的！……！！再尝试下面的sql语句，果然还是一样的结果。Mysql默认的字符检索策略：utf8_ge

逍遥斩舞 0喜欢 / 0评论 2020-02-14

Marshal.PtrToStringAnsi中文乱码

查看内存后知道内存编码是UTF8，Marshal不支持UTF转换，所以必须先转成Unicode再转成UTF8

81214051 0喜欢 / 0评论 2020-01-28

PHP读取文件,解决中文乱码UTF-8的方法分析

本文实例讲述了PHP读取文件,解决中文乱码UTF-8的方法。分享给大家供大家参考，具体如下：。******************************************丑陋的分割线来告诉大家上面的不好的：下面的才是正确的方法哈哈*********

zyyjay 0喜欢 / 0评论 2020-01-22

[MySQL] 导入数据时防止出现乱码

当我们在进行导入sql语句的操作时,一定要注意是否设置了编码,如果没有设置编码,在php代码中进行读取时会出现乱码.mysql -uroot -p123456 数据库名 --default-character-set=utf8 < /xxx.sql

kuwoyinlehe 0喜欢 / 0评论 2020-01-02

在linux centos7 上安装java运行时环境，

第一步，安装mysql，mysql> GRANT ALL PRIVILEGES ON *.* TO ‘root‘@‘%‘ IDENTIFIED BY ‘你设置的密码‘ WITH GRANT OPTION;mysql> show variable

末点 0喜欢 / 0评论 2020-01-09

LeetCode 393. UTF-8 Validation

A character in UTF8 can be from1 to 4 byteslong, subjected to the following rules:. For 1-byte character, the first bit is a 0,

yaohustiAC 0喜欢 / 0评论 2020-01-06

Notepad++ 使用Python 插件批量转换文本文件（字幕文件）为 UTF8

有时候从网上下载了中英文的字幕文件，字符编码是ANSI的，需要转换为UTF-8的编码格式。可以实现批量转换。在Search搜索框中输入：Python Script , 然后选择插件，再点击Install 安装。然后找到刚才保存的脚本，并执行。如果Pytho

学习备忘录 0喜欢 / 0评论 2020-01-04

Linux 中文乱码

打开vim的配置文件，位置在/etc/vim/vimrc

xujidong0 0喜欢 / 0评论 2013-04-03

Centos下文本文件格式转码

最近遇到服务器网站的目录下的所有文件的编码全是gb2312，直接用cat或者vim打开显示都是乱码，网页显示出来当然也全是乱码，所以要解决怎么把目录下的所有文件由gb2312转码成utf-8的问题。网上一顿搜，总共用了三种方法，最后终于把问题解决了。第二种

Justypc 0喜欢 / 0评论 2013-03-29

Ubuntu下MySQL中文乱码解决

修改/etc/mysql/my.cnf sudo gedit /etc/mysql/my.cnf 在my.cnf文件中的[client]段和 [mysqld]段加上以下两行内容： [client] default-character-set=utf8 [m

yhljxy 0喜欢 / 0评论 2013-06-09

mysql建数据库的字符集与排序规则

一般选择utf8.下面介绍一下utf8与utfmb4的区别。utf8mb4兼容utf8，且比utf8能表示更多的字符。unicode编码区从1 ～ 126就属于传统utf8区，当然utf8mb4也兼容这个区，126行以下就是utf8mb4扩充区，什么时候你

sofast 0喜欢 / 0评论 2019-12-29

utf8和utf8mb4的区别

MySQL在5.5.3之后增加了这个utf8mb4的编码，mb4就是most bytes 4的意思，专门用来兼容四字节的unicode。好在utf8mb4是utf8的超集，除了将编码改为utf8mb4外不需要做其他转换。当然，为了节省空间，一般情况下使用u

88540591 0喜欢 / 0评论 2019-12-26

MySQL乱码的原因和设置UTF8数据格式

MySQL使用时，有一件很痛苦的事情肯定是结果乱码。将编码格式都设置为UTF8可以解决这个问题，我们今天来说下为什么要这么设置，以及怎么设置。在编程语言中，我们为了防止中文乱码，会使用unicode对中文字符做处理，而为了降低网络带宽和节省存储空间，我们使

xiaobaif 0喜欢 / 0评论 2019-12-20

MySQL中utf8 && utf8mb4

记住，永远不要在MySQL中使用“utf8”。数据库编码，从utf8转到utf8mb4

luotuofeile 0喜欢 / 0评论 2019-12-16

python,利用socketserver模块实现并发聊天

利用socketserver模块很容易实现并发功能,下面的server.py和client.py程序实现了这一功能.

chouliqingke 0喜欢 / 0评论 2019-12-14

python2与python3编码（练习）

#_author:来童星#date:2019/12/9import jsons=‘star‘a=s.encode(‘utf8‘)print(s,type(s))# star <class ‘str‘>print(a.decode(‘utf8‘)

fgleeldq 0喜欢 / 0评论 2019-12-09

写代码注意了，千万不要在 MySQL 中使用 UTF-8

MySQL数据库一知半解？阿里架构师写得高性能MySQL文档你不能错过。正文开始：最近我遇到了一个bug，我试着通过Rails在以“utf8”编码的MariaDB中保存一个UTF-8字符串，然后出现了一个离奇的错误：。问题的症结在于，MySQL的“utf8

huaishuming 0喜欢 / 0评论 2019-12-07

Mysql 排序规则选择

其特征有以下几点：。utf8_general_ci 不区分大小写，这个你在注册用户名和邮箱的时候就要使用。区分大小写，而且可以存二进制的内容。utf8_unicode_ci准确度高，但校对速度稍慢。用一句话概况上面这段话：utf8_unicode_ci比较

mycosmos 0喜欢 / 0评论 2019-12-02

实战经验：Mysql 字符集及排序规则

MySQL新建数据库时，字符集和排序规则如何选择？本文来简单总结一下。通常，为了统一前后端编码，尤其是设计到源代码、页面文件、页面输入以及数据库字符集等，若不相统一，往往会照成莫名其妙的乱码现象。总结排序规则是指对特定字符集下不同字符的比较规则。也可以简单

everlasting 0喜欢 / 0评论 2019-11-28

ios url 编码和解码

请求后，返回的数据，如何显示的是这样的格式：%3A%2F%2F，此时需要我们进行UTF-8解码，用到的方法是：

lly00 0喜欢 / 0评论 2013-08-25

MySql从命令行导入SQL脚本时，中文出现乱码

在图形界面管理工具 MySql Query Browser中打开脚本，并执行，不会有任何问题；但是使用mysql命令行工具执行建库脚本时，添加数据中如果包含中文，存入的数据就是乱码或是???。。。解决方法1:在MySql安装目录下找到my.ini，将[my

80497310 0喜欢 / 0评论 2014-03-14

Python中 sys.setdefaultencoding(\"utf8\") 的作用详解

设置python默认字节流编/解码器按照utf8解码方式，把字节流编/解码为unicode；在将字节流使用str()方法转换为str对象时，会调用默认的encode函数，如果没有上述系统的默认编码设置，则自动使用‘ascii‘ codecs进行编码，对于非

88384957 0喜欢 / 0评论 2019-11-09

MySQL字符集utf8修改为utf8mb4

对于mysql 5.5 而言，如果不设定字符集，mysql默认的字符集是 latin1 拉丁文字符集；utf8mb4兼容utf8，且比utf8能表示更多的字符，是utf8字符集的超集。当然调整的最好方法是客户端，mysql数据库的字符集都修改为utf8mb

lpfvip00 0喜欢 / 0评论 2019-11-09

python基础字符编码转换

#python2上所有的字符编码都需要先decode到unicode,再从unicode encode到目标编码。#二进制转换为字符串，使用decode，此处二进制的编码格式如果填写错误可能会导致二进制无法转换为字符串，导致程序报错。#python3上默认

JakobHu 0喜欢 / 0评论 2019-11-09

中文转换成html中的utf-8

在HTML中，中文的“好好学习”可以表示为　“好好学习”后来继续沟通，才发现要的是html-utf8的；没有找到合适的golang工具包，涉及语言转码的包主要有maho

swiftwwj 0喜欢 / 0评论 2019-11-08

Json解析异常Value of type java.lang.String cannot be converted to JSONObject

在4.0版本没有问题，但在2.3.7版本就遇到这问题很奇怪，我的josn是用ultraEdit文本编辑器保存为UTF-8的，但还是报这错误，后来查到了：。该异常有 json 文件编码所引起的，所以切切不要应用记事本编辑 json 文件，而应选择其他文本

xuxl00 0喜欢 / 0评论 2014-05-13

Go语言流程控制01--选择结构之if

}else if birthday >= "0923" && birthday <= "1022"{

tydldd 0喜欢 / 0评论 2019-10-31

设置utf-8为默认编码

这种方法是临时的，只在程序执行时生效，系统默认编码并没有改变。为了防止重新设置默认编码影响原本依赖ASCII编码的程序，Python编译器在启动时特意清除了sys模块的setdefaultencoding方法。经测试，reload后也没有启用setdefa

wklken的笔记 0喜欢 / 0评论 2019-10-27

windows server2008 R2下mysql 5.7版本中修改编码为utf-8的方法步骤

在mysql安装目录下找到my.ini文件。就能将mysql数据库默认编码改为utf-8. 网上很多资源都是在[mysqld]下添加。如果这样改会导致5.7版本mysql无法打开

阿亮 0喜欢 / 0评论 2019-10-23