我知道以下Unicode编码:
还有更多的Unicode编码吗?所有的Unicode编码是否还在使用,或者其中一些现在已经过时了?
发布于 2018-04-26 14:51:45
有一个Unicode (实际上有不同的版本)。
您可以定义任何类型的编码,这并不重要。
有UTF-16 are,UTF-16 are,UTF-32 are,UTF-32 are作为表的正式编码。另外,在Unicode标准中,您有UTF-8、UTF-16和UTF-32的描述。
UCS2是旧的unicode编码(等于UTF-16,但只支持代码< 65536),所以现在它已经过时了(由UTF16代替,它能够编码所有(也是更新的) unicode代码点)。UTF-7也是过时的。
还有愚人节的UTF-9和UTF-18。
有些应用程序具有UTF8-sig (即具有初始BOM的UTF-8 ).
在邮件中,您可能会使用UTF8 + BASE64或其他一些双重编码。
Mysql使用UTF8MB3和UTF8MB4,因此它指定了UFT-8,还指定了每个SQL保留多少字节(3或4)。
Python3使用混合编码(在内部,您可能从未见过):根据整个字符串中较大的代码,UTF-8、UTF-16或UTF-32 (“编码”与字符串长度一起保存,在“真字符串”之外)。这也是一种编码。
我们有21位来描述任何unicode代码点。然后,我们可以自由地选择任何编码(以能够返回到原始代码点的方式)。UTF-8、UTF-16和UTF-32只是最常见的(在Unicode标准中描述)。
https://stackoverflow.com/questions/50043154
复制相似问题