怀化网站网站建设,腾讯云免费云服务器,企业商城源码,哪里有网站建站公司一、前言有时候遇到这种情况#xff0c;你用一个like语句查询#xff0c;查到的结果中有一些并没有包含你查询的关键词的纪录#xff1b;有时候遇到这种情况#xff0c;你的数据库自作聪明的大小写不敏感#xff0c;让你在更新时把大小写不同的两条记录都更新了#xff1…一、前言有时候遇到这种情况你用一个like语句查询查到的结果中有一些并没有包含你查询的关键词的纪录有时候遇到这种情况你的数据库自作聪明的大小写不敏感让你在更新时把大小写不同的两条记录都更新了有时候遇到这种情况你的查询语句一切正常查询却失败了报告Illegal mix of collations错误你很困惑在想数据库是不是坏了。。。其实 这些都和数据库字符集的校对规则有关了解了校对规则你就知道怎样处理这些问题。那么校对规则是怎么回事呢它是一组规则负责决定某一字符集下的字符进行比较和排序的结果。比如说有latin1字符集中的字母A和a我们需要它们在比较的时候相等那么我们可以使用字符集校对规则 latin1_general_ci这种校对规则在比较和排序的时候不区分大小写如果我们需要他们在比较的时候不等呢也很简单我们可以使用字符集校对规则latin1_bin;这种校对规则会以二进制的方式对字符进行比较很明显a和A的二进制编码不同比较的结果就是不等。上面的场景说明了校对规则在最简单情况下起的作用实际情况与此并没有太多不同只不过稍微有些复杂而已。二、校对规则总览我们可以使用SHOW COLLATION 指令来查看数据库支持的校对规则在图中我们列出了数据库支持的latin1字符集的校对规则。为什么一种字符集竟然有这么多种的校对规则呢因为在不同的情况下对比较的结果有不同的期待所以就有了不同的校对规则。前面说的大小写敏感(latin1_general_cs)和不敏感(latin1_general_ci)是两种校对规则根据二进制方式进行比较(latin1_bin)也是一种校对规则德国人(latin1_german1_ci)和西班牙人(latin1_spanish_ci)使用的某些不同的拉丁字符在某些情况下是等价的所以有了两种新的校对规则。举个例子在latin1_german1_ci中如下字符是等价的而他们具有不同的外形和编码。当然它们的编码不同所以在latin1_bin校对规则下他们又是不等价的了。A,a,À,Á,Â,Ã,Ä,Å,Æ,à,á,â,ã,ä,å,æ三、校对规则导致的问题1、混合校对规则比较两个字符串比较要求两者必须有相同的校对规则或者两者的校对规则是相容的——所谓相容是指两种校对规则优先级不同比较的时候两者使用高优先级的校对规则进行比较比如latin1_bin的优先级相对较高。CREATE TABLEtbl (col_aint(11) default NULL,col_bchar(20) character set latin1 collate latin1_general_ci default NULL,col_cchar(20) character set latin1 collate latin1_german1_ci default NULL,col_dchar(20) character set latin1 collate latin1_bin default NULL,KEYcol_a (col_a),KEYcol_b (col_b)) ENGINEMyISAM DEFAULT CHARSETlatin1在这个表中col_b、col_c、col_d的校对规则各不同其中latin1_general_ci和latin1_german1_ci 校对规则同级不能进行比较如果强行比较的话就会报错如下mysql select * from tbl where col_b col_c;ERROR1267 (HY000): Illegal mix of collations (latin1_general_ci,IMPLICIT) and (latin1_german1_ci,IMPLICIT) for operation 而latin1_general_ci和latin1_bin的优先级不同latin1_bin高于latin1_general,因此比较的时候会按照latin1_bin的规则进行比较。mysql select * from tbl where binary col_b col_d;Emptyset (0.00 sec)当然可以在sql语句中强制指定校对规则进行比较下面这个例子就说明了这一点mysql select * from tbl where col_b COLLATE latin1_danish_ci col_c COLLATE latin1_danish_ci;Emptyset (0.00 sec)2、校对规则导致的问题——SELECT出错误的记录在上面的基础上我们要演示一个常见的问题我们需要对该数据表进行一定的处理alter table tbl modify col_b collate latin1_swedish_ci default null;insert into tbl (col_b) values (hao123);然后进行下面的查询我们希望查询的是包含“刘”的记录hao123这个和“刘”没有任何关系的条目被选了出来看起来很奇怪。不过这不是数据库出了问题而是校对规则的使用上存在问题下面是我们使用ultraedit察看字符串的二进制编码的结果在gbk编码下hao123的编码为68 61 6f 31 32 33而刘的编码位C1 F5。在前面的latin1_swedish_ci 校对规则中可以看到61和C1都与41等价6F和F5都与4F等价这就是ao 刘的原因。解决办法有两个1)修改该字段的字符集和校对规则改成gbk这该问题不在存在。这是完美的解决方案不过有些时候你没有权限对数据库进行这样的改动。mysql alter table tbl modify col_b char(20) charset gbk default null;Query OK,1 row affected (0.01sec)Records:1 Duplicates: 0 Warnings: 0mysql select * from tbl where binary col_b like like %刘%;Emptyset (0.00 sec)2)查询的时候声明校对规则为latin1_bin 。这样可以在一定程度上缓解这个问题不过如果col_b中只要含有c1 f5,就会被选出来——而c1 f5可能恰好是另外两个字符的前半截和后半截或者干脆就是 Á õ ....mysql select * from tbl where binary col_b like %刘%;Emptyset (0.00 sec)转载http://hi.baidu.com/cuttinger/item/e23013e372ee62adce2d4fda