Unicode 代码点或字符范围的名称和常规类别
此文件及其描述可从 Unicode Consortium 获得,网址如下:
http://www.unicode.org
在Java中,char...对于辅助平面,那么一个码点将会是两个代码单元
在Unicode简介中,我们有说到,一个字符在Unicode字符集中的二进制值称为代码点
在UTF-16编码中,0号平面内,一个码点16位表示,称之为一个代码单元...总结下就是:
Unicode字符集中,一个字符对应一个代码点
UTF-16中,16位数表示的是一个代码单元
那么在0 号平面内,一个代码单元就能够表示一个代码点
但是在辅助平面,一个代码点需要两个代码单元...java中的char就是UTF-16中的代码单元
所以说,一个char表示一个代码单元,可能并不是一个字符
实在理解不了的话,就可以记住,有些字符需要两个char表示,一个char可能仅仅是某个字符的一半...而Unicode也可能是有两个代码单元组成
也就是一个代码单元可能完整的表示了一个代码点,也可能是一个代码点的一部分
除非你真的有必要对UTF-16中的代码单元进行操作,