首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >C# -将已剥离的UTF编码字符串转换回UTF。

C# -将已剥离的UTF编码字符串转换回UTF。
EN

Stack Overflow用户
提问于 2016-01-20 18:03:04
回答 2查看 94关注 0票数 1

因此,我有一个字符串,实际上是UTF编码字符,去掉了ASCII表示代码:"537465616d6c696e6564“这将在ASCII编码的UTF中表示为\x53\x74\x65 .

我尝试过将Regexp替换到正确的位置,对其进行字节编码,并将其读取为UTF,但没有结果。

在C#中将ASCII字符串转换为可读UTF的最有效方法是什么?

EN

Stack Overflow用户

回答已采纳

发布于 2016-01-20 18:18:06

因此,据我所知,您有一个字符串"537465616d6c696e6564“,实际上意思是char[] chars = { '\x53', '\x74', ... }

首先将此字符串转换为字节数组( How can I convert a hex string to a byte array? )。

为了您的方便:

代码语言:javascript
运行
复制
public static byte[] StringToByteArray(string hex) {
    return Enumerable.Range(0, hex.Length)
                     .Where(x => x % 2 == 0)
                     .Select(x => Convert.ToByte(hex.Substring(x, 2), 16))
                     .ToArray();
}

然后有许多UTF编码(UTF-8,UTF-16),C#内部使用UTF-16 (实际上是其中的子集),所以我假设您需要UTF-16字符串:

代码语言:javascript
运行
复制
string str = System.Text.Encoding.Unicode.GetString(array);

如果解码后得到不正确的字符,也可以尝试UTF-8编码(以防您不知道确切的编码,Encoding.UTF8)。

票数 1
EN
查看全部 2 条回答
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/34907290

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档