首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >C#将“a”解码为"TM“

C#将“a”解码为"TM“
EN

Stack Overflow用户
提问于 2013-08-19 11:18:44
回答 1查看 5.5K关注 0票数 2

在网页上有以下字符串

高通快讯S4™™

当我在我的.net代码中得到这个字符串时,该字符串转换为"Qualcomm“S4”

字符"TM“改为-

如何将“a”解码回"TM“

更新

折叠是使用webproxy下载字符串的代码。

wc是网络代理

代码语言:javascript
运行
复制
wc.Headers.Add("Accept-Charset", "ISO-8859-1,utf-8");
string html = Server.HtmlEncode(wc.DownloadString(url));
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2013-08-19 11:23:32

首先,您应该阅读网页的正确编码。在本例中,您似乎正在使用Encoding.Default (可能是CP1252)阅读,页面实际上是UTF-8。通过读取响应的Content-Type头或在内容中查找<meta http-equiv="Content-Type" content='text/html; charset=utf-8'>,这一点应该是显而易见的。

如果您在事后仍然需要这样做,那么请使用

代码语言:javascript
运行
复制
var bytes = Encoding.Default.GetBytes(myString);
var correctString = Encoding.UTF8.GetString(bytes);

在任何情况下,您都需要知道页面上使用的确切编码以及首先用于读取格式错误的字符串。此外,我通常建议不要使用Encoding.Default,因为它的值不是固定的。它只是Windows系统上用于非Unicode应用程序的遗留编码,也用作默认的非Unicode文本文件编码。它在处理外部资源方面不应有任何地位。

票数 6
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/18312519

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档