关于C#中的字符串和字符,我有一个问题。我发现C#中的字符串是Unicode字符串,而char需要2个字节。所以每个字符都是UTF-16编码的。这很棒,但我也在Wikipedia上看到UTF-16中有一些字符需要4个字节。
我正在做一个程序,可以让你为字母数字显示绘制字符。在程序中还有一个测试器,你可以在那里写一些字符串,它会为你绘制它,让你看看它看起来是什么样子。
那么我应该如何处理字符串,其中用户写了一个字符,需要4个字节,即2个字符。因为我需要逐个字符遍历字符串,所以在列表中找到这个字符,并将其绘制到面板中。
发布于 2012-12-23 11:57:08
你可以这样做:
for( int i = 0; i < str.Length; ++i ) {
int codePoint = Char.ConvertToUTF32( str, i );
if( codePoint > 0xffff ) {
i++;
}
}
则codePoint
将任何可能的代码点表示为32位整数。
发布于 2012-12-23 12:05:48
完全使用String
对象;根本不要使用Char
。使用IndexOf
的示例
var needle = "ℬ"; // U+1D49D (I think)
var hayStack = "a code point outside basic multi lingual plane: ℬ";
var index = heyStack.IndexOf(needle);
String
类上的大多数方法都有接受Char
或String
的重载。Char
上的大多数方法都有使用String
的重写。只要不使用Char
即可。
https://stackoverflow.com/questions/14010736
复制相似问题