我对编码有点困惑。据我所知,旧的ASCII字符每个字符占用一个字节。Unicode字符需要多少字节?
我假设一个Unicode字符可以包含来自任何语言的所有可能的字符-我说的对吗?那么每个字符需要多少字节呢?
UTF-7、UTF-6、UTF-16等是什么意思?它们是不同版本的Unicode吗?
我读过Wikipedia article about Unicode,但它对我来说很难。我期待着看到一个简单的答案。
发布于 2011-03-13 23:09:47
好吧,我也打开了维基百科的页面,在介绍部分我看到了"Unicode可以由不同的字符编码实现。最常用的编码是UTF-8 (它对任何ASCII字符使用一个字节,它在UTF-8和ASCII编码中具有相同的代码值,最多四个字节用于其他字符),现在已经过时的UCS-2 (它对每个字符使用两个字节,但不能在当前Unicode标准中对每个字符进行编码)“。
正如这段引述所示,您的问题在于您假设Unicode是一种单一的字符编码方式。实际上,Unicode有多种形式,在这句话中,其中一种甚至每个字符都有一个字节,就像你习惯的那样。
所以你想要的简单答案是它是不同的。
https://stackoverflow.com/questions/5290182
复制相似问题