似乎是一个相当热门的问题,但我还没有找到解决方案;可能是因为它有太多的味道。不过,这就是它。我正在尝试读取一些逗号分隔的文件(有时,分隔符可以比逗号更独特一些,但现在逗号就足够了)。
这些文件应该是整个行业的标准化文件,但最近我们看到了许多不同类型的字符集文件。我希望能够设置一个BufferedReader来补偿这一点。
执行此操作并检测其是否成功的标准方法是什么?
关于这种方法,我的第一个想法是遍历字符集simple->complex,直到我可以无异常地读取文件。虽然不是很理想。
感谢您的关注。
发布于 2012-02-08 02:24:19
Mozilla的universalchardet被认为是有效的探测器。juniversalchardet是它的java端口。还有一个端口。请阅读本文以了解更多信息Character Encoding Detection Algorithm
https://stackoverflow.com/questions/9181530
复制相似问题