在平时的mysql运维操作中,经常会碰到插入中文字段后出现乱码的情况,产生中文乱码的原因一般有: 1)mysql的编码格式不对,是latin1编码。强烈推荐将mysql下的编码格式都改为utf8,因为它兼容世界上所有字符! 2)mysql的表的语系设定问题(包含character与collation) 3)客户端程式(例如php)的连线语系设定问题
下面就对Mysql下处理数据表中中文字段乱码问题的操作做一记录: 为了防止后续操作出现乱码现象,最好在创建库或数据表的时候就设置正确的编码。 创建数据库的时候,设置编码格式
mysql> CREATE DATABASE hqsb
-> CHARACTER SET utf8
-> COLLATE utf8_general_ci;
Query OK, 1 row affected (0.01 sec)
创建表的时候,设置编码格式
mysql> use hqsb;
Database changed
mysql> CREATE TABLE haha (
-> id int(10) PRIMARY KEY AUTO_INCREMENT,
-> name varchar(64) NOT NULL
-> ) ENGINE=InnoDB DEFAULT CHARSET=utf8;
Query OK, 0 rows affected (0.02 sec)
这3个设置好了,基本就不会出问题了,即建库和建表时都使用相同的编码格式。
如果在建库建表的时候没有指明编码格式导致中文乱码,可以通过以下方式进行查询。 1)查看mysql系统默认的编码格式(保证下面查询结果中的所有编码格式都是utf8,有不是的就手动修改!):
mysql> show variables like "%char%";
+--------------------------+----------------------------------+
| Variable_name | Value |
+--------------------------+----------------------------------+
| character_set_client | gbk |
| character_set_connection | gbk |
| character_set_database | utf8 |
| character_set_filesystem | binary |
| character_set_results | gbk |
| character_set_server | utf8 |
| character_set_system | utf8 |
| character_sets_dir | /usr/local/mysql/share/charsets/ |
+--------------------------+----------------------------------+
8 rows in set (0.01 sec)
手动进行修改:
mysql> SET character_set_filesystem='utf8';
Query OK, 0 rows affected (0.00 sec)
再次查看是否已修改:
mysql> show variables like "%char%";
+--------------------------+----------------------------------+
| Variable_name | Value |
+--------------------------+----------------------------------+
| character_set_client | utf8 |
| character_set_connection | utf8 |
| character_set_database | utf8 |
| character_set_filesystem | utf8 |
| character_set_results | utf8 |
| character_set_server | utf8 |
| character_set_system | utf8 |
| character_sets_dir | /usr/local/mysql/share/charsets/ |
+--------------------------+----------------------------------+
8 rows in set (0.01 sec)
2)查看数据库(比如hqsb)的编码格式:
mysql> show create database hqsb;
+----------+---------------------------------------------------------------+
| Database | Create Database |
+----------+---------------------------------------------------------------+
| hqsb | CREATE DATABASE `hqsb` /*!40100 DEFAULT CHARACTER SET utf8 */ |
+----------+---------------------------------------------------------------+
1 row in set (0.00 sec)
如果数据库的编码格式不正确,可以手动修改:
mysql> ALTER DATABASE hqsb DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;
Query OK, 1 row affected (0.01 sec)
3)查看数据表(比如haha)的编码格式:
mysql> show create table haha;
+-------+--------------------------------------------------------------------------------------------------------------------------------------------------------+
| Table | Create Table |
+-------+--------------------------------------------------------------------------------------------------------------------------------------------------------+
| haha | CREATE TABLE `haha` (
`id` int(10) NOT NULL AUTO_INCREMENT,
`name` varchar(64) NOT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 |
+-------+--------------------------------------------------------------------------------------------------------------------------------------------------------+
1 row in set (0.00 sec)
如果数据表的编码格式不正确,可以手动修改:
mysql> ALTER TABLE haha DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;
Query OK, 0 rows affected (0.01 sec)
注意: 在客户端(比如xshell)里连接mysql插入数据,最好事先确保编码格式为Utf-8。
解决网页中乱码的问题 1)将网站编码设为utf-8。 2)如果网站已运作了好久,并有很多旧数据,不能再更改简体中文的设定,那么建议将页面的编码设为GBK。 GBK与GB2312的区别就在于:GBK能比GB2312显示更多的字符,要显示简体码的繁体字,就只能用GBK。 3)编辑/etc/my.cnf ,在[mysql]段加入default_character_set=utf8; 4)在编写Connection URL时,加上?useUnicode=true&characterEncoding=utf-8参数; 5)在网页代码中加上一个"set names utf8"或者"set names gbk"的指令,告诉MySQL连线内容都要使用utf8或者gbk;