Python使用cElementTree.iterparse解析XML的内存不足_使用python解析嵌套的XML_使用Python解析XML文档 - 腾讯云开发者社区

、、、

下面是我的XML解析函数的简化版本： import xml.etree.cElementTree as ET it = ET.iterparse(file(xml)) count += 1 print('count: {0}'.format(count)) 这会导致Python耗尽内存

浏览 1提问于2011-10-08得票数 22

5回答

在Python中拆分大型XML文件

、

我希望将一个巨大的XML文件拆分成更小的部分。我想浏览整个文件，寻找一个特定的标签，然后抓取和之间的所有信息，然后将其保存到一个文件中，然后继续浏览文件的其余部分。我的问题是试图找到一种清晰的方法来记录标记的开始和结束，这样我就可以在使用"for line in f“浏览文件时抓取其中的文本。我不想使用标记变量。有没有一种巨蟒式的方法来完成这件事？

浏览 0提问于2009-01-25得票数 10

1回答

使用多处理划分和征服etree.iterparse

、、、

因此，让我们设想一个大的xml文档(文件大小>100mb)，我们想要使用cElementTree.iterparse进行迭代解析。from itertools import islice tree_iter = etree.iterparse(

浏览 0提问于2011-01-22得票数 0

1回答

cElementTree.ParseError:顶层的多个元素

、、

我有这个python代码，它接受XML文件作为输入。当我运行执行时，我会得到问题标题中指出的错误： self.TreeBuilder.start(element.tag, element.attrib)> File "/usr

浏览 3提问于2013-03-11得票数 0

回答已采纳

2回答

在使用cElementTree的iterparse方法时，我如何知道元素的父元素？

、、、

我希望遍历xml文件的元素并生成每个元素，除非父元素是一个特征。 for event, element in cElementTree.iterparse('../test.xml'): yield element 如何获取元素的父元素？我知道使用tree.getiterator()函数是可行的，但

浏览 0提问于2012-02-18得票数 2

回答已采纳

1回答

创建大型字典的Python内存错误

、、

我正在尝试处理一个3GB的XML文件，并在循环中间得到一个内存错误，该循环读取该文件并将一些数据存储在字典中。self.latitude = float(latitude) self.count = 0 nodes[osm_id] = Node(osm_id, lat, lon)

浏览 0提问于2016-04-07得票数 3

回答已采纳

1回答

如何在java中将大型XML转换为字符串

、、、

作为PIG脚本的一部分，我需要获得使用UDF生成的XML，并且XML太大(大约1.5GB)。目前，我正在使用下面的代码将XML转换为字符串。();这会抛出OutofMemoryError，因为StringWriter在内部使用字符串缓冲区，它依赖于Arrays.As数组，索引使用整数，并且XML<em

浏览 0提问于2017-02-20得票数 0

3回答

如何在Android应用程序中解析webservice中的大量xml数据？

、

我是Android应用程序开发的新手。Android中有没有其他解析器可以解析大量的XML数据。我真的需要尽快得到这个。

浏览 0提问于2010-12-06得票数 0

2回答

在Groovy中解析wikipedia xml转储

、

最近我想处理维基百科的数据。在这种情况下，我下载了它的en-lang XML转储。它超过了44 It。我想我应该用XmlSlurper来解析它，根据文档，它对于解析大型XML文件来说已经足够好了。不幸的是，我得到了一些“内存不足异常”。在Groovy中有什么方法(使用现有的库)来解析这个“怪物文件”吗？

浏览 0提问于2014-05-02得票数 0

1回答

为什么cElementTree迭代解析不返回任何元素？

、、

我试图用cElementTree.iterparse解析一个xml文件。但是，我不明白发生了什么，因为iterparse返回空元素。我有一个xml文件，其大致布局如下： <ID id="1"> <DATE>21.01.2010</DATE>import xml.e

浏览 0提问于2015-03-08得票数 0

回答已采纳

1回答

android中tablelayout中的addview问题

我正在使用sax解析器解析一个大的xml文件，同时通过添加到包含大量记录的tablelayout来显示给用户。我得到一个内存不足的错误。在tablerow中，我添加了textview。

浏览 1提问于2011-03-01得票数 0

2回答

解析大型xml文件时出现Java堆空间错误

、

我想解析一个大的xml文件(785MB)，并将数据写入csv。当我试图解析文件时，我得到了java堆空间错误(内存不足)。我尝试将堆大小增加到1024mb，但代码可以处理最大50mb的文件。请让我知道一个解决方案解析大型xml文件在java。

浏览 0提问于2014-10-16得票数 0

4回答

expat解析器:内存消耗

、、、、

我正在使用expat解析器解析一个大约15 GB的XML文件。问题是它抛出一个“内存不足”错误，程序中止。我想知道有没有什么机构遇到过类似的问题，或者它是一个已知的bug，并在后来的版本中得到了纠正？

浏览 13提问于2009-03-18得票数 0

回答已采纳

1回答

我必须对字符串进行HTML转义(HTML转义的XML文件(因此字符串中的所有val都是& lt;TAG& gt;val& lt;/TAG& gt；等等)大小约为1，4MB，这样我就可以在解析器中使用未转义的XML ) 我遇到的问题是，当我使用StringEscapeUtils.unescapeHtml( String ) (apache-commons-lang-2.6库)尝试获取未转义<em

浏览 2提问于2011-05-22得票数 1

回答已采纳

1回答

如果安装了特定的模块，如何在python中提供某些功能？

、、

在这样做时，它可以调用一些命令并解析它们的输出。在某种程度上，我现在扩展了这个模块，使它能够解析XML输出。当然，从那时起，这个模块就有了对lxml的依赖。直到我碰巧在Raspbian安装上使用我的python模块。由于这个安装是很新的，所以我尝试使用lxml安装pip。没有在那个平台上编译。(我猜是因为500 MByte的内存不足以在这样的平台上构建lxml。)

浏览 1提问于2017-10-28得票数 1

回答已采纳

1回答

几个表上SQLite3 executemany() insert生成器的高效设计

、、、

我正在将大量大型xml文件解析为python中的sqlite3数据库。据我所知，(尽管我非常开放并寻求更多的性能选项)，更好的选项是sqlite3 3用于插入的executemany()函数。parse_document(path): This object keeps track of the current 'document' type element from a

浏览 0提问于2019-03-07得票数 1

1回答

在Android设备上解析大型XML文件时的内存问题

、、、、

我有一个Android应用程序，它为用户解析XML文件，并以更加移动友好的格式显示结果。这个应用程序对大多数用户来说都很好，但是有些用户拥有大量的数据，应用程序会崩溃，因为内存不足。在进行了一定量的解析之后，是否有任何方法可以让DOM样式的XML解析器退出解析数据？我只需要前30个左右的元素，这样才能使应用程序更加高效。我想使用SAX或pull解析</em

浏览 4提问于2010-06-15得票数 1

2回答

如何在Java中避免OutOfMemoryError？

、

我有这个2GB的xml文件，我需要解析它并将它的数据存储到数据库中。这导致内存不足的异常.有人能帮我避免这样的错误吗？Java中是否存在按需堆分配和沉积的现象？

浏览 5提问于2013-06-10得票数 0

3回答

从大型ListView填充XML

、、、

我正在进行一个包含列表视图的活动。listview是由从服务器提取的大型XML填充的。我的场景通常是有一个SAX解析器，解析XML并返回一个Vector(或类似的结构)和解析后的数据。问题是xml太大，Vector的元素太多，这会导致内存不足错误。此外，xml有指向正在下载的图像的链接，这会使情况变得更糟。在

浏览 2提问于2012-07-23得票数 3

回答已采纳

1回答

XmlSpy:自动生成xml解析器中的内存泄漏

、、

我使用Altovas XmlSpy 2011R3 SP1生成了一个 xml解析器。解析器基于Xerces 3.1，并用作具有MFC支持的动态链接库。我得到了xerces内部的内存泄漏信息，它只是运行由altova解析器生成的示例，该解析器从文件中加载xml，并对其不做任何其他操作。漏洞由visual和boundschecker检测到。只要在循环中从文件中加载xml，就会导致内存不足</e

浏览 2提问于2011-09-12得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Python内存不足使用cElementTree.iterparse解析XML

在Python中拆分大型XML文件

使用多处理划分和征服etree.iterparse

cElementTree.ParseError:顶层的多个元素

在使用cElementTree的iterparse方法时，我如何知道元素的父元素？

创建大型字典的Python内存错误

如何在java中将大型XML转换为字符串

如何在Android应用程序中解析webservice中的大量xml数据？

在Groovy中解析wikipedia xml转储

为什么cElementTree迭代解析不返回任何元素？

android中tablelayout中的addview问题

解析大型xml文件时出现Java堆空间错误

expat解析器:内存消耗

当HTML取消转义字符串时，Android内存不足异常

如果安装了特定的模块，如何在python中提供某些功能？

几个表上SQLite3 executemany() insert生成器的高效设计

在Android设备上解析大型XML文件时的内存问题

如何在Java中避免OutOfMemoryError？

从大型ListView填充XML

XmlSpy:自动生成xml解析器中的内存泄漏

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐