我正在使用XMLReader解析来自第三方的XML。这些文件应该是UTF-8格式的,但我得到了这个错误:
parser error : Input is not proper UTF-8, indicate encoding !
Bytes: 0x11 0x72 0x20 0x41 in C:\file.php on line 166
查看notepad++中的XML文件,很明显是什么导致了这种情况:在有问题的行中包含了一个控制字符DC1。
XML文件是由第三方提供的,我不能让他们可靠地修复这个问题/确保以后不会发生这种情况。有人能推荐一个处理这个问题的好方法吗?我只想去掉控制字符--在本例中,只需从XML文件中删除它就可以了--但我担心这样做可能会导致将来无法预见的问题。谢谢。
发布于 2011-08-27 23:53:33
为什么第三方不能可靠地解决这个问题?如果他们的XML中包含非法字符,我敢打赌这是一个合法的问题。
话虽如此,为什么不在使用str_replace解析字符之前将其删除呢
https://stackoverflow.com/questions/7215573
复制相似问题