首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >UTF-8和ISO-8859-1有什么区别?

UTF-8和ISO-8859-1有什么区别?
EN

Stack Overflow用户
提问于 2011-08-13 13:21:30
回答 8查看 477.5K关注 0票数 463

UTF-8ISO-8859-1之间的区别是什么

EN

回答 8

Stack Overflow用户

发布于 2011-08-13 13:26:55

UTF-8是一种多字节编码,可以表示任何Unicode字符。ISO 8859-1是一种单字节编码,可以表示前256个Unicode字符。两者以完全相同的方式对ASCII进行编码。

票数 363
EN

Stack Overflow用户

发布于 2011-08-13 13:30:17

维基百科很好地解释了这两种情况:UTF-8Latin-1 (ISO-8859-1)。前者是可变长度编码,后者是单字节固定长度编码。拉丁-1只编码Unicode字符集的前256个代码点,而UTF-8可用于编码所有代码点。在物理编码级别,只有代码点0- 127进行相同的编码;代码点128 - 255的不同之处在于成为UTF-8的2字节序列,而它们是拉丁语-1的单字节序列。

票数 147
EN

Stack Overflow用户

发布于 2016-08-24 03:15:56

UTF

UTF是一系列多字节编码方案,可以表示Unicode代码点,这些代码点可以表示多达2^31个大约20亿个字符。UTF-8是一种灵活的编码系统,它使用1到4个字节来表示前2^21个大约200万个代码点。

长话短说:任何码位/序数表示低于127的字符,也就是7位安全的ASCII,与大多数其他单字节编码一样,由相同的1字节序列表示。任何码位在127以上的字符都由两个或更多字节的序列表示,其中包含最好解释的编码here的细节。

ISO-8859

ISO-8859是一系列单字节编码方案,用于表示可在127到255范围内表示的字母表。这些不同的字母表被定义为ISO-8859-n格式的“部件”,其中最熟悉的可能是“ISO-8859-1 -1”。与UTF-8一样,无论使用哪种编码系列,7位安全的ASCII都不会受到影响。

这种编码方案的缺点是它无法容纳由超过128个符号组成的语言,也不能同时安全地显示一个以上的符号族。此外,随着UTF的兴起,ISO-8859编码已经失宠。负责这项工作的ISO“工作组”已于2004年解散,将维护工作留给了其上级小组委员会。

票数 95
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/7048745

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档