文章/答案/技术大牛

发布

社区首页 >问答首页 >尝试解析XML时出现MalformedByteSequenceException

问尝试解析XML时出现MalformedByteSequenceException
EN

Stack Overflow用户

提问于 2010-05-07 15:30:01

回答 2查看 6.1K关注 0票数 1

我有以下来自维基百科的.gpx数据：

<?xml version="1.0" encoding="UTF-8" standalone="no" ?>
<gpx xmlns="http://www.topografix.com/GPX/1/1" creator="byHand" version="1.1" 
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
xsi:schemaLocation="http://www.topografix.com/GPX/1/1 http://www.topografix.com/GPX/1/1/gpx.xsd">
  <wpt lat="39.921055008" lon="3.054223107">
    <ele>12.863281</ele>
    <time>2005-05-16T11:49:06Z</time>
    <name>Cala Sant Vicenç - Mallorca</name>
    <sym>City</sym>
  </wpt>
</gpx>

当我调用我的解析方法时，我得到一个异常(见下文)。调用如下所示：

Document tmpDoc = getParsedXML(currentGPX);

我的解析方法看起来像这样(标准的解析代码，没有什么令人兴奋的……)：

    public static Document getParsedXML(String fileWithPath){
    DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
    DocumentBuilder db;
    Document doc = null;
    try {
        db = dbf.newDocumentBuilder();
        doc = db.parse(new File(fileWithPath));
    } catch (ParserConfigurationException e) {
        e.printStackTrace();
    } catch (SAXException e) {
        e.printStackTrace();
    } catch (IOException e) {
        e.printStackTrace();
    }
    return doc;
    }

这段简单的代码抛出了以下异常：

com.sun.org.apache.xerces.internal.impl.io.MalformedByteSequenceException: Invalid byte 2 of 3-byte UTF-8 sequence.
at com.sun.org.apache.xerces.internal.impl.io.UTF8Reader.invalidByte(Unknown Source)
at com.sun.org.apache.xerces.internal.impl.io.UTF8Reader.read(Unknown Source)
at com.sun.org.apache.xerces.internal.impl.XMLEntityScanner.load(Unknown Source)
at com.sun.org.apache.xerces.internal.impl.XMLEntityScanner.skipChar(Unknown Source)
at com.sun.org.apache.xerces.internal.impl.XMLDocumentFragmentScannerImpl$FragmentContentDriver.next(Unknown Source)
at com.sun.org.apache.xerces.internal.impl.XMLDocumentScannerImpl.next(Unknown Source)
at com.sun.org.apache.xerces.internal.impl.XMLDocumentFragmentScannerImpl.scanDocument(Unknown Source)
at com.sun.org.apache.xerces.internal.parsers.XML11Configuration.parse(Unknown Source)
at com.sun.org.apache.xerces.internal.parsers.XML11Configuration.parse(Unknown Source)
at com.sun.org.apache.xerces.internal.parsers.XMLParser.parse(Unknown Source)
at com.sun.org.apache.xerces.internal.parsers.DOMParser.parse(Unknown Source)
at com.sun.org.apache.xerces.internal.jaxp.DocumentBuilderImpl.parse(Unknown Source)
at javax.xml.parsers.DocumentBuilder.parse(Unknown Source)
at Zeugs.getParsedXML(Zeugs.java:38)
at Zeugs.main(Zeugs.java:25)

我猜错误出在第一个文件的格式中，但我不知道具体在哪里。你能给我一个提示吗？

xml

exception

parsing

utf-8

回答 2

Stack Overflow用户

回答已采纳

发布于 2010-05-07 16:35:18

我建议您的文件尚未保存为UTF-8格式。

票数 5

Stack Overflow用户

发布于 2014-07-31 02:50:38

我的一个程序中也有同样的错误报告。但该错误仅在Windows控制台中运行jar时发生。在linux或eclipse中(右键单击main class file > run as Java Application)，错误不会发生。

我猜这是因为Windows上设置的默认编码(Cp..)与linux和eclipse上的UTF-8进行比较。要在运行jar时更改缺省值，只需将-Dfile.encoding=UTF8参数添加到jvm

java -Dfile.encoding=UTF8 -jar myjar.jar

程序依赖此参数的原因可能是在使用输入流或读取器实现时没有显式指定编码。

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/2786926

复制

相似问题

问尝试解析XML时出现MalformedByteSequenceException
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问尝试解析XML时出现MalformedByteSequenceExceptionEN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问尝试解析XML时出现MalformedByteSequenceException
EN