首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >这是对Unicode的很好的描述吗?

这是对Unicode的很好的描述吗?
EN

Stack Overflow用户
提问于 2009-06-22 13:29:38
回答 5查看 423关注 0票数 0

这是我对Unicode的描述。请进行更正和评论。

Unicode将字符的表示与存储字符的机制分开。这与ANSI不同,ANSI中每个字符都由一个字节表示。 ANSI代码页将字符映射到字节表示形式。Unicode将字符映射到代码点。代码点是一个抽象的概念。编码方案的责任是以字节表示Unicode代码点。 有许多Unicode编码方案。一些编码方案使用固定的字节数来表示Unicode代码点。这种方法必须平衡编码可以表示的代码点的数量和所需的存储空间。其他编码方案使用可变字节数来表示Unicode代码点。这种方法使数据解析变得复杂,但它们避免了固定字节长度编码所受的“表示范围”/“存储空间”约束。 UTF-8是最常见的Unicode编码。UTF-8的普及是因为它与ASCII兼容.ASCII是ANSI的一个子集,包含英文字母、数字和常见的标点符号。UTF-8是一种可变长度的编码,能够编码所有Unicode代码点.

EN

回答 5

Stack Overflow用户

回答已采纳

发布于 2009-06-22 13:57:25

这里可能是提到Joel的关于unicode,每个程序员都应该知道些什么的好地方

票数 4
EN

Stack Overflow用户

发布于 2009-06-22 13:52:09

有几点更好: ASCII兼容性并不是UTF-8-AFAIK流行的唯一(甚至主要)原因,ASCII兼容性的一个非常普遍的副作用是,转换为UTF-8的ASCII字符串的字节大小是相同的。换句话说,当编写很少或没有非ASCII字符的文本时,您将得到ASCII的所有好处,而对于非ASCII字符则只会多几个字节。此外,我相信所有的官方Unicode编码都能够表示所有Unicode代码点。

票数 1
EN

Stack Overflow用户

发布于 2009-06-22 13:43:44

听起来相当准确。您可能需要添加这样的内容: UTF-8通常用于存储文本文档,并且通常用于通过有线传输文本,因为它是紧凑的,而UTF-16也非常常见,因为Java和.NET字符串类使用UTF-16,因为它是高效的。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/1027229

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档