首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

字符集与字符编码的区别与演进(ASCII、GBK、UNICODE)

演进:GB2312(2字节)→扩展繁体字→GBK(2字节)→扩展少数民族中日韩等→GB18030国家标准(4字节)。...注意GBK都是向下兼容的,即GB18030兼容GB2312,因为使用的编码位置没有重叠。 1.3.1 大五码 Big5码是一套双位元组字符集,使用了双八码储存方法,以两个字节来安放一个字。...具体来说,定义的是下列字节: 范围 第1字节 第2字节 编码数 字数 水准GBK/1 A1–A9 A1–FE 846 717 水准GBK/2 B0–F7 A1–FE 6,768 6,763 水准GBK/...3 81–A0 40–FE (7F除外) 6,080 6,080 水准GBK/4 AA–FE 40–A0 (7F除外) 8,160 8,160 水准GBK/5 A8–A9 40–A0 (7F除外) 192...2.3 GBK 事实上我们使用的GBK、GB18030都是标准,但由于我们的标准只对应一套特定的字符集,所以可以认为GBK就是字符集

1.1K20
您找到你想要的搜索结果了吗?
是的
没有找到

警示:AL32UTF8字符集不是ZHS16GBK字符集的超集

今天有客户向我咨询:数据库由ZHS16GBK字符集修改为AL32UTF8字符集,发现中文的数据中小部分出现乱码,客户认为AL32UTF8明明可以支持更多的文字,不应该出现这样的情况才对。...不过,之前也一直有个误区,我们都知道AL32UTF8是可以支持多国语言的字符集,对于中文字节存储占用空间比ZHS16GBK多,然后第一反应就认为AL32UTF8应该是ZHS16GBK的超集。...这就说明我们要改的AL32UTF8字符集并不是ZHS16GBK的超集。...而客户端是Windows,chcp结果是936,也就是ZHS16GBK,这也进一步说明了ZHS16GBK和AL32UTF8字符集的不同。...同时实验还验证,如果数据库字符集本身是AL32UTF8,想修改成为ZHS16GBK字符集,也是一样的情况,需要加internal_use参数才可以转换,也就是说这种转换一样可能出现乱码,不过这个情况反倒好理解

1.7K60

Linux下MySQL的彻底卸载和安装配置字符集

前言: Linux环境下MySQL的安装和配置在网上已经有很多教程了。之所以写这篇文章是因为在配置字符集的时候找了网上的一些教程发现并不能用导致折腾了一阵子。下面的教程均是亲自实践。...MySQL的彻底卸载 首先查看一下自己是否已经安装了MySQL。代码如下: 1 ps -aux|grep mysql 如未安装则不显示任何内容,若安装则会显示如下的信息: ?...MySQL字符集的配置 首先我们在终端打开mysql: 1 mysql -uroot -p 然后输入密码即可进入mysql 然后我们输入下面的查询语句来查看默认的字符集设置: 1 show variables...可以看出我们的character_set_database和character_set_server两处还未设置成utf8(或者GBK)。 下面我们只需要在mysql的配置文件修改即可。...接下来进入mysql,再来看一下字符集设置: ? 可以看到除了system之外均该为了utf8. 注意 改字符集之前建立的数据库内的数据仍是中文乱码,这时我们备份一下数据新建即可。

1.7K70

相克军_Oracle体系_随堂笔记013-字符集

>chcp 活动代码页: 936 字符集其实就是“字符”和“编码”的一张对照表, 数据库安装过程中,会选择确认下面两个字符集: 1.数据库字符集:数据库需要存储多国语言选择AL32UTF8,只有中英文选择...ZHS16GBK 2.国家字符集 一般都选用AL16UTF16 unicode字符集: UTF8 很老的,不用了。...注:实际生产环境,如果确定数据库只是中国人用(只有中英文相关字符)的话,就采用ZHS16GBK.. sql*plus客户端(设置原则:与所在操作系统字符集一致): windows:一般都是gbk,即chcp...linux:一般为utf-8,即echo $LANG 结果为en_US.UTF-8 或zh_CN.UTF-8 export NLS_LANG=american_america.utf8 测试:客户端Linux...服务器操作系统字符集(暂时忽略) ps: 1.因为sql*plus 本身没有字符集,依赖于所在操作系统的字符集,而在远端linux上的oracle也是无法直接访问到windows上的字符集,所以依靠sql

64110

GB2312、GBK、GB18030 这几种字符集的主要区别是什么?

1 GB2312-80 GB 2312 或 GB 2312-80 是中国国家标准简体中文字符集,全称《信息交换用汉字编码字符集·基本集》,又称 GB 0,由中国国家标准总局发布,1981 年 5...对于人名、古汉语等方面出现的罕用字,GB 2312 不能处理,这导致了后来 GBK 及 GB 18030 汉字字符集的出现。...GBK 编码区分三部分: 汉字区 包括 GBK/2:OXBOA1-F7FE, 收录 GB 2312 汉字 6763 个,按原序排列; GBK/3:OX8140-AOFE,收录 CJK 汉字 6080...图形符号区 包括 GBK/1:OXA1A1-A9FE,除 GB 2312 的符号外,还增补了其它符号 GBK/5:OXA840-A9AO,扩除非汉字区。...3 GB18030 GB 18030,全称:国家标准 GB 18030-2005《信息技术中文编码字符集》,是中华人民共和国现时最新的内码字集,是 GB 18030-2000《信息技术信息交换用汉字编码字符集基本集的扩充

2.2K31

mysql安装配置详解教程

MySQL数据库具有跨平台性,不仅可以在Windows上运行,还可以在UNIX,Linux和Mac OS等操作系统上运行  1.先简单说下MySQL的版本: 根据操作系统的类型可分为:Windows版、...UNIX版、Linux版和Mac OS版 根据用户群体的不同可分为:社区版(Community Edition)和企业版(Enterprise),社区版完全免费,企业版是收费的 根据发布顺序来区分可分为... 下面介绍Mysql在常用系统Windows和Linux下的安装配置  2.在Windows上安装与配置MySQL MySQL在Windows上的安装包有两种:图形化界面的安装和免安装(noinstall...,我选择了第三个“Manual Selected Default Character Set/ Collation”,选择字符集为“gbk”,next Standard Character Set:默认字符集为...Collation:手动选择字符集,选择gbk或者gb2312,二者区别:gbk字库容量大,包括了gb2312 19> 选择是否将mysql安装为windows服务,默认勾选,Service Name

65420

mysql有关运维的面试题_mysql数据库运维面试题「建议收藏」

字符集的数据库oldboy,并查看已建库的完整语句 mysql> create database oldboy character set gbk collate gbk_chinese_ci; mysql...mysql> select user,host from mysql.user; 7.进入oldboy数据库 mysql> use oldboy 8.创建一innodb引擎字符集GBK表test,字段为...命令行恢复以上删除的数据 mysql -uroot -poldboy -S /data/3306/mysql.sock 18.把GBK字符集修改为UTF8(可选,注意,此题有陷阱) mysql> show...网站程序字符集 2. 客户端的字符集 3. 服务器端字符集 4. linux客户端字符集 5....utf8_general_ci -DEXTRA_CHARSETS=gbk,gb2312,utf8,ascii 提示:二进制软件包,安装的数据库字符集默认latinl 21.在把id列设置为主键,在Name

1.9K30

centOS 中文乱码解决方案

-a |grep "zh_CN" zh_CN zh_CN.gb18030 zh_CN.gb2312 zh_CN.gbk zh_CN.utf8 说明系统已安装中文语言包,无需再安装。...{字符集} zh是中文的代号、CN是中国的代号、gb18030,gb2312,utf8是语言字符集 那么每一项可以通俗理解为 “你是说中文的,你在中国,语言字符集是gb18030/gb2312/utf8...重启系统 # reboot 5.远程工具SSH Secure 乱码问题的解决 使用远程工具进行连接时,如果 linux 有中文文件或目录,显示时会出现乱码,原因 是 linux 编码是 UTF-8,...而远程工具默认是当前系统本地编码即 GBK。...所以解决方案是统 一两者编码就 OK 了,但是该 SSH Secure 工具不能设置编码,所以通过修改 linux 的系 统编码的方式进行统一编码。 第一步:查看当前系统的语言环境。

6K20

TASKCTL产品安装常见问题

答:taskctl安装后默认的用户名密码都是admin,后期的用户、密码都是通过Admin程序来管理。 Q:服务器端安装乱码怎么解决?...答:可以通过修改终端或者远程连接工具(如:Xmanager、putty、SSHSecureShell、SecureCRT等)的会话字符集,将其修改为GBK/GB18030类字符集,重新连接服务端会话即可显示为中文...答:linux服务端配置端口是否开放(防火墙iptables/Firewall开放端口)(针对前期已经有正常使用的用户可能是端口开放时临时生效的,重启后失效导致)。 Q:怎么确定服务器是正常启动?...答:在安装用户用 ctlninfo 命令查看相关属性,即可看到 taskctl 后台服务是否正常启动 。 Q:安装过程中服务报启动失败?...答:TASKCTL 的字符集GBK ,修改当前 shell 的环境变量 LANG 为 zh_CN.GBK,命令范例:LANG=zh_CN.GBK. Q:Windows客户端安装成功但无法运行程序?

66020

【Oracle字符集】识别及转换导出文件的字符集

,Solaris是Big-Endians,Linux是Little-Endians,所以Linux上的输出通过交换可以得到: 0303 5445 58504f52 …....to_char('852','xxxx') from dual; TO_CH ----- 354 对应前两张图 第2、3字节,就知道该导出文件字符集为ZHS16GBk。...最常见的转换发生在从US7ASCII到ZHS16GBK之间。 由于很多数据库最初以US7ASCII字符集存储中文,单纯通过导出导入是无法完成字符集转换的。...对于这种情况,可以通过设置导出字符集为US7ASCII,原样导出数据;导出后修改导出文件的第二、三字符,修改0001为0354,这样就可以将US7ASCII字符集的数据正确导入到ZHS16GBK的数据库中...如果导出文件使用的字符集是US7ASCII,目标数据库的字符集是ZHS16GBK,就可以使用create database的方法来修改,具体操作如下: ? ?

3.5K40

windows平台下编辑的内容传到linux平台出现中文乱码的解决办法

现象说明:在windows下编辑的内容,上传到linux平台下出现中文乱码。...文件,将字符集改为"UTF-8" 按Win键+run出现"运行",在里面输入"notepad"即可打开记事本。...主机传文件是经常的事,但有时文件名有中文,传到Linux机器会有乱码,选择起来也很麻烦,下面简单说下应对方法: 解决办法: 一般这种问题是文件的编码字符集、Shell编码字符集、XShell编码字符集不匹配...临时办法 1)简体中文的Windows一般使用GB字符集,这里将XShell设置为GBK 2) Linux主机 [root@AppServer1 ~]# export LANG=zh_CN.gbk 或者...永久生效 1) XShell属性设置 2) Linux环境变量设置 [root@AppServer1 ~]# vim /etc/profile export LANG=zh_CN.gbk /

2.2K80
领券