首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

php中常见编码问题

PHP程序设计中中文编码问题曾经困扰很多人,导致这个问题的原因其实很简单,每个国家(或区域)都规定了计算机信息交换用的字符编码集,如美国的扩展 ASCII 码, 中国的 GB2312-80,日本的 JIS 等。作为该国家/区域内信息处理的基础,字符编码集起着统一编码的重要作用。字符编码集按长度分为 SBCS(单字节字符集),DBCS(双字节字符集)两大类。早期的软件(尤其是操作系统),为了解决本地字符信息的计算机处理,出现了各种本地化版本(L10N),为了区分,引进了 LANG, Codepage 等概念。但是由于各个本地字符集代码范围重叠,相互间信息交换困难;软件各个本地化版本独立维护成本较高。因此有必要将本地化工作中的共性抽取出来,作一致处理,将特别的本地化处理内容降低到最少。这也就是所谓的国际化(118N)。各种语言信息被进一步规范为 Locale 信息。处理的底层字符集变成了几乎包含了所有字形的 Unicode。

02
您找到你想要的搜索结果了吗?
是的
没有找到

MySQL中涉及的几个字符集

character-set-server/default-character-set:服务器字符集,默认情况下所采用的。 character-set-database:数据库字符集。 character-set-table:数据库表字符集。 优先级依次增加。所以一般情况下只需要设置character-set-server,而在创建数据库和表时不特别指定字符集,这样统一采用character-set-server字符集。 character-set-client:客户端的字符集。客户端默认字符集。当客户端向服务器发送请求时,请求以该字符集进行编码。 character-set-results:结果字符集。服务器向客户端返回结果或者信息时,结果以该字符集进行编码。 在客户端,如果没有定义character-set-results,则采用character-set-client字符集作为默认的字符集。所以只需要设置character-set-client字符集。

02

MySQL8——带有字符集的UDF

如果您点开这篇文章,估计您已经知道MySQL中用户定义函数(UDF)的用途。如果您需要快速了解UDF,请参阅MySQL参考手册“https://dev.mysql.com/doc/refman/8.0/en/adding-udf.html”。如果您创建过自己的UDF,是否曾经遇到过与UDF相关的字符集问题?如果遇到过,这篇文章将会提供一些帮助,如果您打算编写新的UDF,最好也阅读一下这篇文章。MySQL UDF框架在最初设计时,没有考虑字符串参数和返回值的字符集。这意味着UDF的参数和返回值将会使用“二进制”字符集。即使用户定义了字符集,服务器返回的字符串,也会忽略该字符集。现在,我们已经向UDF框架添加了字符集功能,用户可以读取或设置UDF参数的字符集,还可以根据需要转换返回值的字符集。

02

Visual Studio中C++关于Unicode字符集和多字节字符集

原本标准字符集为8位的ASCII码,但世界上的书写语言不能简单地用256个8位代码即一字节表示,就试更宽的值,例如16位值。这就是Unicode非常简单的原理。与混乱的256字符代码映射,以及含有一些单字节代码和一些双字节代码的双字节字符集不同,Unicode是统一的16位系统,这样就允许表示65536个字符。在这里会高兴地告诉你前128个Unicode字符(16位代码从0x0000到0x007F)是ASCII码,而接下来的128个Unicode字符(代码从0X0080到0X00FF)是ISO 8859-1对ASCII的扩展。Unicode中不同部分的字符都同样基于现有的标准。 Unicode对表示所有字符及世界上使用象形文字的语言,包括一些列的数字、符号和货比的集合来说用16位来表示是充裕的,因此Unicode包含了世界上所有的字母、符号、数字以及中文等在内的字符。

03

securecrt 乱码

大家好,又见面了,我是你们的朋友全栈君。SecureCRT 连接 Linux 时经常会看到乱码。 发生乱码的原因主要是有三个地方 1.Linux 的 etc 的系统默认配置的编码 2.用户环境变量里面设置的 LANG 变量 3.SecureCRT 会话变量里面的字符集的设置 只要保持这三个地方的字条集编码保持一致就可以了。 解决步骤如下: 1.设置用户的环境变量 查询当前用户的 Local 信息: # export |grep LANG declare -x LANG=”zh_CN.GB18030″ 设置用户的 Local 为 UTF-8 # env lang=zh_CN.utf8 HOSTNAME=devdbserver TERM=vt100 SHELL=/bin/bash HISTSIZE=1000 NLS_LANG=AMERICAN SSH_CLIENT=::ffff:192.168.14.12 51137 22 SSH_TTY=/dev/pts/2 JRE_HOME=/usr/java/jdk1.5.0/jre …….. lang=zh_CN.utf8 # 可以看到现在用户的环境变量将语言设置成为了 lang=zh_CN.utf8。 2.设置 SecureCRT。 设置步骤如下图所示: 需要说明的是: 设置字符编码跟用户变量一样后,可能还会出现中文乱码。 原因是字体引起的。 因为有些字体无法显示中文,所以中文就会出现乱码。 所以在选择字体时,应该选择那支持中文的字体

03
领券