如何在Python中迭代解析大型XML文件？_解析大型压缩xml文件,python_如何在python中解析大型JSON文件 - 腾讯云开发者社区

、、、、

我需要处理一个大约8 8Gb的大.XML文件。文件结构(简化)如下： <TopLevelElement> <Element>zzz</Element> ....and so函数get_all_records接收以下输入: a) XML文件的路径；b)记录类别('RecordType1‘或'RecordType2')；c)选择哪个名称组件 fro

浏览 16提问于2021-08-13得票数 0

回答已采纳

1回答

在python中更改和解析大型XML文件的内存高效方法

、、、、

我想在python中解析一个大型XML文件(25 GB)，并更改它的一些元素。“迭代解析”也应该仅用于解析，而不是修改。有没有其他的选

浏览 2提问于2015-04-24得票数 1

回答已采纳

1回答

将XML元素打印为XML文本

、、

我的问题我试过什么通常的嫌疑人- RTFM，和。但是，我只能迭代到子元素中，而不能打印项XML表示。for xml_filename in xm

浏览 1提问于2019-11-08得票数 0

1回答

这一整天都让我抓狂，我希望能在解析一个大型XML文件方面得到一点帮助.文件包含超过900,000行并以gzip格式下载，我确实有一些东西在用minidom测试和解析它时使用数据的摘录，但这并不是要为完整的文件剪切它，所以我正在研究迭代解析，但是我只是无法让任何一个示例工作，甚至到我无法导入错误的程度……我唯一可以使用的导入是导入xml.eTree.cElementTree，但我发现的大多数代码示例似乎几乎不起作用。我

浏览 1提问于2016-04-22得票数 2

回答已采纳

1回答

无法使用php读取XML节点值-抛出错误，因为‘已分配的内存耗尽’

、

我有一个大小约为305MB的XML文件。我使用下面的代码来解析该XML。如果我将PHP libxml升级到2.7或更高版本，那么解析大型XML文件会有什么好处吗？数据在其中有很多子节点(由于机密性，我不能共享数据)。除了增加内存限制(在PHP中)或解析大型XML文件(如python或perl)之外，还有什么方法可以解决这个问题

浏览 0提问于2017-05-03得票数 0

2回答

XML元素树在内存中一次一个

、、、

我有相当大的xml文件和相对较少的内存。在解析文件时，我目前正在将整个文件加载到内存中，如下面的代码片段所示，这会减慢整个计算机的运行速度，有时甚至无法工作。也许在处理当前文件时加载下一个文件时使用一些多处理，比如在深入学习中使用。root = ET.parse("my_file.xml").getroot() do_something()

浏览 13提问于2022-01-14得票数 1

3回答

如何加快使用BeautifulSoup解析10 up文件的速度

、、、、

我正在使用范围在3到10‘m之间的Beautifulsoup解析大型HTMl文件。不幸的是，99%的数据是我想要解析的内容。该文件实际上包含一个小的头、几个js脚本，然后包含1,000到10,000个条目。我尝试过多种常见的优化，例如：( a)使用不同的解析器，( b)使用SoupStrainer，( c)定义编码 ( b)和c)当我记录所需时间时，实际上没有任何效果。不同的解析器有很大的影响。当我在1.5k项列表(相当小的列表)上运行下面的脚本时，我得到了以下

浏览 6提问于2015-03-20得票数 4

1回答

如何在python中解析大型XML文件？

、、、

我正在使用python版本2.7.*，我需要获得youtube播放列表。v=2').read())问题是我不能解析结果… playlist = minidom.parse(playlist_<e

浏览 2提问于2013-12-07得票数 2

回答已采纳

8回答

在Python中解析大型XML文档的最快方法是什么？

、、、

我目前正在根据Python第12.5章运行以下代码： def __init__(selffor c in self.children if c.name == name] return list(self.children) r

浏览 12提问于2008-11-27得票数 72

回答已采纳

4回答

解析Jython中大型XML文档的最佳方法

、、、、

我需要解析来自Jython的大型(>800 to ) XML文件。XML并不是很深的嵌套，包含了大约一百万个相关元素。我需要将这些元素转换成真实的对象。解析器在本文档中遇到了"64,000“以上的实体扩展；这是应用程序施加的限制。我还没有找到解决这个问题的方法，所以我可能需要寻找另一个XML库。它可以是Java或者Jy

浏览 9提问于2011-02-23得票数 0

2回答

如何使用包含不同标签的Ruby解析巨大的XML文件？

、、、

我有几个大的XML文件，如下所示： <Listing> <StreetAddress>123 Main St</StreetAddress解析一系列大型XML文件(每个文件包含相似的条目但具有不同的标记名)的好方法是什么？我想维护一个标记名的映射表是有意义的，但是如何使用Ruby高效地迭代这些映射表呢？我想获取<Li

浏览 2提问于2013-07-03得票数 1

1回答

Python迭代解析按属性排序的大型xml文件

、、、、

我有一个很大的XML文件，我试图给每个程序的图标排序，我想按宽度属性中的值排序图标，我已经删除了一些不需要的图标，但是我不确定如何排序图标，如果能提供任何帮助，我将不胜感激。我使用迭代解析，因为读取整个文件占用了大量内存。删除以下内容的现行代码：xml_source = 'ss_sky_sw_xmltv.xml' xml_output = 'ss_sky_

浏览 7提问于2019-10-22得票数 1

回答已采纳

3回答

如何使用ElementTree解析RegEx以找到特定的RegEx？

、、、

使用Python2.7.6和ElementTree从文件系统加载/解析一个RegEx文件，然后遍历该文件，将特定的RegEx存储到数据结构中。因此，在我的项目文件夹中，我有一个名为person.html的HTML：import web t

浏览 4提问于2015-11-17得票数 2

回答已采纳

1回答

在python中高效解析破碎的XML/HTML

、、、、

我希望能够在Python中高效地解析大型HTML文档。我知道和。但是，这两种方法都不能处理损坏XML，HTML读取这些XML也是如此。此外，文档可能包含其他损坏的XML。类似地，我知道像这样的答案，它建议根本不使用任何形式的迭代解析，事实上，这就是我正在使用的。但是，我正在尝试优化我的程序中最大的瓶颈，即文档的解析。此外，我使用用于lxml解析器的SAX风格的目标处理程序做了一些实验-我不确定发生了什么，但它直接导致

浏览 0提问于2014-01-26得票数 2

1回答

深度优先模式下的RapidXML解析

、、、、

我试图使用RapidXML在C++中解析一个大型XML (1.8GB)。虽然我可以使用以下方法获取任何特定节点的子节点：...我不知道如何首先解析深度。RapidXML不为其提供任何内置的迭代器。对于大型xml处理(在DOM中</

浏览 5提问于2016-04-11得票数 0

回答已采纳

2回答

在C++中使用Python而不是XML来加载资源？

、、、、

我正在用c++构建一个简单的2D游戏(用于学习目的)，目前正在使用TinyXML解析XML文件，以加载我的纹理和其他资源。然而，最近我对python很感兴趣，出于各种原因(再次出于学习目的)，我希望使用python而不是XML。我想知道是否可以将XML中的对象转换为python中的大型元组，然后使用嵌入式python解释器解析元组的元素，并将数据提取到我的C++游

浏览 2提问于2013-11-19得票数 2

2回答

lxml和ElementTree有什么不同？

、、

# Importing lxml and ElementTreeimport xml.etree.ElementTree Python的lxml库和ElementTree

浏览 7提问于2017-11-10得票数 60

回答已采纳

1回答

在Python中解析大型XML文件

、、、

我们有一个来自API的大型XML文件，我需要将其转换为SQL Server表。使用pyodbc将表装载到SQL中是没有问题的，但是我很难解析16mb的XML文件。该文件格式良好-它被包装在单个根目录中。几个星期以来，我一直在寻找解决方案，但一直没有能够通过反复试验来解决这个问题。任何帮助都是非常感谢的。简而言之，目标是以表格格式输出XML文件中包含的所有值，其中每条记录都在各自的行

浏览 1提问于2018-04-01得票数 1

2回答

Python中的大型XML文件解析

、、、、

我有一个4GB大小的XML文件。我想解析它并将它转换成一个数据框架来处理它。但是，由于文件大小太大，下面的代码无法将文件转换为Pandas数据帧。代码只是继续加载，不提供任何输出。但是，当我将它用于类似的较小大小的文件时，我将获得正确的输出。有人能提出解决这个问题的办法吗。可能是一种代码，它加速了从XML到数据帧的转换过程，或者将XML文件分割成更小的子集。如果有人建议我应该在我的个人系统(2GB RAM)上处理这么大的XM

浏览 7提问于2020-06-25得票数 5

回答已采纳

1回答

用xml迭代解析从大型xml文件中删除元素

、、

我是Python的新手，最近我一直用它来解析一个700 xml的大格式xml文件。环顾四周之后，我一直试图使用迭代解析方法来删除一个名为Revision_History的元素，因为我们不再需要这些信息。for event, elem in ET.iterparse("AAT.xml",

浏览 1提问于2015-02-10得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云