首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >编码和字符集有什么区别?

编码和字符集有什么区别?
EN

Stack Overflow用户
提问于 2010-02-17 22:55:24
回答 6查看 48.8K关注 0票数 165

我对文本编码和字符集感到困惑。由于很多原因,我不得不在接下来的工作中学习非Unicode、非UTF8的东西。

我在电子邮件头中找到了单词"charset“,就像在"ISO-2022-JP”中一样,但在文本编辑器中没有这样的编码。(我查看了不同的文本编辑器。)

文本编码和字符集有什么区别?如果你能给我展示一些用例,我将不胜感激。

EN

回答 6

Stack Overflow用户

发布于 2010-02-17 22:59:29

每种编码都有一个与之相关联的特定字符集,但是对于给定的字符集,可以有多个编码。字符集就是它听起来的样子,一组字符。有大量的字符集,包括许多专用于特定脚本或语言的字符集。

然而,我们在向Unicode过渡的道路上走得很好,Unicode包括一个能够表示几乎世界上所有脚本的字符集。但是,Unicode有多种编码。编码是将字符串映射到字节字符串的一种方式。Unicode编码的示例包括UTF-8UTF-16 BEUTF-16 LE。对于特定的应用程序或机器体系结构,其中的每一个都有优势。

票数 95
EN

Stack Overflow用户

发布于 2010-02-17 23:01:25

字符集或字符表只是一组字符(一个无序集合)。编码字符集为指令集中的每个字符分配一个整数(“代码点”)。编码是将代码点明确表示为字节流的一种方式。

票数 15
EN

Stack Overflow用户

发布于 2010-02-17 23:16:00

我用谷歌搜索过了。http://en.wikipedia.org/wiki/Character_encoding

区别似乎是微妙的。术语charset实际上并不适用于Unicode。Unicode经历了一系列抽象。抽象字符->代码点->编码将代码点转换为字节。

字符集实际上跳过了这一步,直接从字符跳到字节。字节序列<->字符序列

简而言之,编码:代码点->字节字符集:字符->字节

票数 8
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/2281646

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档