UTF-8和ISO-8859-1之间的区别是什么
发布于 2011-08-13 13:26:55
UTF-8是一种多字节编码,可以表示任何Unicode字符。ISO 8859-1是一种单字节编码,可以表示前256个Unicode字符。两者以完全相同的方式对ASCII进行编码。
发布于 2011-08-13 13:30:17
发布于 2016-08-24 03:15:56
UTF
UTF是一系列多字节编码方案,可以表示Unicode代码点,这些代码点可以表示多达2^31个大约20亿个字符。UTF-8是一种灵活的编码系统,它使用1到4个字节来表示前2^21个大约200万个代码点。
长话短说:任何码位/序数表示低于127的字符,也就是7位安全的ASCII,与大多数其他单字节编码一样,由相同的1字节序列表示。任何码位在127以上的字符都由两个或更多字节的序列表示,其中包含最好解释的编码here的细节。
ISO-8859
ISO-8859是一系列单字节编码方案,用于表示可在127到255范围内表示的字母表。这些不同的字母表被定义为ISO-8859-n格式的“部件”,其中最熟悉的可能是“ISO-8859-1 -1”。与UTF-8一样,无论使用哪种编码系列,7位安全的ASCII都不会受到影响。
这种编码方案的缺点是它无法容纳由超过128个符号组成的语言,也不能同时安全地显示一个以上的符号族。此外,随着UTF的兴起,ISO-8859编码已经失宠。负责这项工作的ISO“工作组”已于2004年解散,将维护工作留给了其上级小组委员会。
https://stackoverflow.com/questions/7048745
复制相似问题