在研究Unicode和utf-8编码时,
我注意到utf-8编码的第129 Unicode以0xc2开头。
我检查了0xcf的最后一个字母。
没有Unicode编码为0xc1。
为什么129 unicode从0xc2开始,而不是0xc1?
发布于 2020-01-05 14:43:43
从0xc1开始的UTF-8将是0x40到0x7f范围内的Unicode代码点。0xc0将是0x00到0x3f范围内的Unicode代码点。
有一个铁规则,每个代码点都以最短的方式用UTF-8表示。由于所有这些代码点都可以存储在一个UTF-8字节中,因此不允许使用两个字节存储它们。
出于同样的原因,您会发现没有以0xf0x80到0xf00x8f开头的4字节代码,因为它们使用较少的字节存储。
https://stackoverflow.com/questions/59600702
复制相似问题