首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >在构造使用数据的XmlReader或XPathDocument之前,如何从基于XML的数据源中删除无效的十六进制字符?

在构造使用数据的XmlReader或XPathDocument之前,如何从基于XML的数据源中删除无效的十六进制字符?
EN

Stack Overflow用户
提问于 2008-08-21 18:47:49
回答 14查看 100.6K关注 0票数 76

在XmlReader中使用基于XML的数据源之前,有没有什么简单/通用的方法来清理它,这样我就可以优雅地使用不符合对XML的十六进制字符限制的XML数据?

注意:

  • 解决方案需要处理使用除UTF-8之外的字符编码的XML数据源,例如通过在XML文档声明处指定字符编码。在去除无效的十六进制字符的同时不损坏源的字符编码一直是一个主要的症结所在。
  • 删除无效的十六进制字符应该只删除十六进制编码值,因为您经常可以在包含字符串的数据中找到href值,该字符串恰好与十六进制字符的字符串匹配。

背景:

我需要使用符合特定格式的基于XML的数据源(比如Atom或RSS提要),但又希望能够使用已经发布的数据源,这些数据源按照XML规范包含无效的十六进制字符。

在.NET中,如果您有一个表示XML数据源的流,然后尝试使用XmlReader和/或XPathDocument对其进行解析,则会由于XML数据中包含无效的十六进制字符而引发异常。我目前尝试解决这个问题的方法是将Stream解析为一个字符串,并使用正则表达式删除和/或替换无效的十六进制字符,但我正在寻找一种性能更好的解决方案。

EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/20762

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档