专栏首页java小白MySQL选择合适的字符集

MySQL选择合适的字符集

对数据库来说,字符集更加重要,因为数据库存储的数据大部分都是各种文字,字符集对数据库的存储,处理性能,以及日后系统的移植,推广都会有影响。 MySQL5.6目前支持几十种字符集,包括UCS-2,UTF-16,UTF-16LE,UTF-32,UTF-8和utf8mb4等Unicode字符集。 根据应用的需求,考虑以下几方面的因素。

  1. 满足应用支持语言的需求,如果应用要处理各种各样的文字,或者将发布到使用不同语言的国家或地区,就应该选择Unicode字符集。对MySQL来说,目前就是UTF-8
  2. 如果应用中涉及已有数据的导入,就要充分考虑数据库字符集对已有数据的兼容性。假如已有数据是GBK文字,如果选择GB2312-80为数据库字符集,就很有可能出现某些文字无法正确导入的问题
  3. 如果数据库只支持一般中文,数据量很大,性能要求也很高,那就应该选择双字节长编码的中文字符集,比如GBK。因为,相对于UTF-8而言,GBK比较“小”,每个汉字只占2个字节,而UTF-8汉字编码需要3个字节,这样可以减少磁盘I/O,数据库Cache以及网络传输的时间,从而提高性能。相反,如果应用主要处理英文字符,仅有少量汉字数据,那么选择UTF-8更好,因为GBK,UCS-2,UTF-16的西文字符编码都是2个字节,会造成很多不必要的开销。
  4. 如果数据库需要做大量的字符运算,如比较,排序等,那么选择定长字符集可能更好,因为定长字符集的处理速度要比变长字符集的处理速度快。
  5. 如果所有客户端程序都支持相同的字符集,则应该优先选择该字符集作为数据库字符集,这样可以避免因字符集转换带来的性能开销和数据损失。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • JAVA初始化顺序

    在一个类里,初始化的顺序是由变量在类内的定义顺序决定的。即使变量定义大量遍布于方法定义的中间, 那些变量仍会在调用任何方法之前得到初始化——甚至在构建器调用...

    秋白
  • Java的break和contunie加(label)标签的用法

    label标签必须放在循环之前,一定要紧跟循环,如果label:下面写了一句代码的话,那么break label;就会报错

    秋白
  • MySQL连接字符集和校对规则

    实际的应用访问来说,存在着客户端和服务器之间交互的字符集和校对规则的设置。 对于客户端和服务器的交互操作,MySQL提供了3个不同的参数:character...

    秋白
  • Confluence 6 数据库字符集编码和问题

    你的数据库和 JDBC 数据源连接必须配置为使用 UTF-8 编码(或者根据你配置的数据库来制定正确的 UTF-8 编码字符集,例如在 Oracle 中使用的是...

    HoneyMoose
  • 数据库防火墙:数据库防火墙商业化的前提条件

    数据库防火墙和一般的传统数据库安全设备不同,它部署在应用服务器和数据库服务器之间。业务系统巨大的流量将穿越数据库防火墙,数据库防火墙任何的风吹草动都会影响业务系...

    数据安全
  • 统计自然语言处理基础-语义消歧

    很多的词语都具有不止一个意思,在不同的语境下往往有不同的含义,也就是所谓的语义歧义。而语义消歧就是为了解决这样的问题。

    数据处理与分析
  • 数据库动态脱敏

    中安威士数据库动态脱敏系统(简称VS-DM),通过截获并修改数据库通讯内容,对数据库中的敏感数据进行在线的屏蔽、变形、字符替换、随机替换等处理,达到对用户访问敏...

    数据库保护
  • 如何修改CDH集群元数据库地址

    在生产环境CDH集群中会遇到元数据库的迁移,迁移后数据库的IP地址发生变化或是元数据库做主备,在主节点挂掉后,我们需要将数据库CDH集群中的元数据库地址指向新的...

    Fayson
  • Ubuntu16.04:常用软件安装

    在/usr/share/vim/vim80/color文件夹里,vim已经自带了十几种主题插件,选择一种即可:

    新码农
  • Ubuntu开发环境配置

    每次电脑切换都需要重新装一次系统,重新装系统后还需要安装各种各样的工具。如果每次都到网络上搜索工具的安装方法,就要浪费一大笔时间。这里把我常用的工具的安装方法分...

    yuxiaofei93

扫码关注云+社区

领取腾讯云代金券