我希望编码并解码包含多语言字符的字符串,其中的语言、长度和字符位置(例如,索引8-10上的汉字)是未知的。
有可能有一个“通用”编码器吗?或者是一些知道如何解码的算法?
搜索网络只想出了一些解决方案,这些解决方案涉及到知道特殊字符在哪里,以及在哪种语言,而我甚至不知道语言本身。
有什么想法吗?
编辑:示例:由几种语言组成的字符串,如:
“你好,我的拉丁}生锈了”
它由英语、汉语和拉丁文组成。
但当我做的时候
var test = ASCIIEncoding.ASCII.GetBytes(someStr);
然后
ASCIIEncoding.ASCII.GetString(test)
“特殊字符”(IE,而不是英文字符)被转换为问号。
发布于 2017-03-01 15:05:37
不要使用ASCII编码,因为它不应该处理同一字符串中的多个语言字符。
改用Unicode:
var test = UnicodeEncoding.Unicode.GetBytes(someStr);
var test1 = UnicodeEncoding.Unicode.GetString(test);
https://stackoverflow.com/questions/42534786
复制相似问题