首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >在UTF-8编码标准中,第一位(即二进制0)是什么意思?

在UTF-8编码标准中,第一位(即二进制0)是什么意思?
EN

Stack Overflow用户
提问于 2018-06-07 15:24:14
回答 2查看 1.5K关注 0票数 1

我是一个专业的开发人员

考虑下面的示例:

我想使用UTF-8编码对单词"hello"进行编码。

所以,

单词”的每个字母的等效代码点如下:

代码语言:javascript
复制
h = 104
e = 101
l = 108
o = 111

因此,我们可以说十进制数列表表示字符串“

104 101 108 108 111

UTF-8编码将像这样存储"hello" (二进制):

代码语言:javascript
复制
01101000 01100101 01101100 01101100  01101111

如果你仔细观察上面的二进制编码值,你就会知道每个十进制数的二进制等价物前面都有二进制位值0

我的问题是,为什么每个可存储字符都要加上这个初始0的前缀?在UTF-8编码中使用它的目的是什么?

当使用UTF-16格式对相同的字符串进行编码时,执行了什么操作?

如果有必要,那么初始的额外字符可以是比特值1

NUL字节是否表示二进制字符0

EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50735223

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档