首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >SourceCharacter in ECMAScript 5.1

SourceCharacter in ECMAScript 5.1
EN

Stack Overflow用户
提问于 2016-05-03 12:22:21
回答 1查看 56关注 0票数 3

我正在阅读ECMAScript规范第5版,但在我看来,这一点还不太清楚。

在第6节-源文本中,规范声明了一个源字符如下:

代码语言:javascript
运行
复制
SourceCharacter::
    any Unicode code unit

在上面写到:

在本文档的其余部分中,“代码单元”和“字符”一词将用于指用于表示单个16位文本单元的16位无符号值。短语"Unicode字符“将用于指由单个Unicode标量值表示的抽象语言或印刷单元(该值可能大于16位,因此可以由多个代码单元表示)。

我认为这句话有点模棱两可,因为有人(像我最初一样)可以认为唯一允许的字符是Unicode表的0-65535之间的字符。

那么,这个句子是模棱两可还是只能使用0-65536之间的字符呢?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-05-03 12:31:42

这是有意的,他们告诉您,任何代码单元都是允许的,然后说,为了澄清源字符的定义,它们通常是指代码单元而不是字符。

注意,在UTF16中,代码单元与代码点不同。

所有东西都是一个16位的代码单元,但是代码点可以由多个代码单元组成。

例如,"“是一个UTF16代码点,但它是两个代码单元。

代码语言:javascript
运行
复制
"".charCodeAt(0) // 55357
"".charCodeAt(1) // 56589
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/37004033

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档