我想知道如何使用LINQ对一个非常大的、嵌套很深的XML文档进行流式处理,同时根据某些条件过滤节点,然后将流式输出写入文件,同时保持XML的原始结构不变。
这应该在不将整个文档加载到内存中的情况下发生。
这个是可能的吗?
发布于 2009-06-23 04:59:40
这篇论文包含了我的问题的答案:
http://homepages.cwi.nl/~ralf/api-streaming-xml/
具体地说,它展示了在流式处理时如何在过滤结果时维护原始XML的树结构。
发布于 2009-06-22 15:31:34
LINQ to XML不支持直接以流的方式读取,但是我已经成功地使用了XmlReader
,根据它进行过滤,然后在发现感兴趣的子树时将其传递给XElement.Load
。它假设子树足够小,可以放入内存中。当Load
返回时,阅读器将被移出那个子树,您可以继续前进,直到找到下一个相关的子树,依此类推。
有关更多信息和示例代码,请参阅this MSDN blog post。
(这是我对Stack Overflow数据转储所做的操作,btw :)
发布于 2009-06-22 22:32:39
有关XML流选项,请查看XML团队关于从http://blogs.msdn.com/xmlteam/archive/2007/03/05/streaming-with-linq-to-xml-part-1.aspx开始使用LINQ to XML进行流的讨论。意识到这是一个早期的博客系列,并且在最终版本中做了一些实现细节的更改。
https://stackoverflow.com/questions/1027815
复制相似问题