开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >为什么没有以0xC1开头的Unicode？

问为什么没有以0xC1开头的Unicode？
EN

Stack Overflow用户

提问于 2020-01-05 14:09:33

回答 1查看 770关注 0票数 0

在研究Unicode和utf-8编码时，

我注意到utf-8编码的第129 Unicode以0xc2开头。

我检查了0xcf的最后一个字母。

没有Unicode编码为0xc1。

为什么129 unicode从0xc2开始，而不是0xc1？

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-01-05 14:43:43

从0xc1开始的UTF-8将是0x40到0x7f范围内的Unicode代码点。0xc0将是0x00到0x3f范围内的Unicode代码点。

有一个铁规则，每个代码点都以最短的方式用UTF-8表示。由于所有这些代码点都可以存储在一个UTF-8字节中，因此不允许使用两个字节存储它们。

出于同样的原因，您会发现没有以0xf0x80到0xf00x8f开头的4字节代码，因为它们使用较少的字节存储。

票数 3

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/59600702

复制

相似问题