我在Windows 64位计算机上使用Python 3.4。
我目前有一个具有多个层次结构的xml文件。在xml树中,有许多元素的名称都是“段落”。但它们可能在不同的层次上。
有没有办法简单地计算这些元素的数量?遍历整个树似乎太耗时了。
发布于 2016-05-17 10:34:17
如果您要使用lxml.etree,那么您将拥有完整的XPath支持,并且可以使用count()
import lxml.etree as ET
tree = ET.parse(xml)
paragraphs = tree.xpath('count(//p)')
print(paragraphs)在xml.etree.ElementTree中,由于limited XPath support的原因,您必须通过findall()和len()在Python语言中执行此操作
import xml.etree.ElementTree as ET
tree = ET.parse(xml)
paragraphs = tree.findall('//p')
print(len(paragraphs)) 发布于 2016-05-17 10:31:16
读取xml文件并获取xmlString格式的内容。如果你所需要的是单词“段落”出现的次数,你可以这样做-
xmlString.count("<paragraph>")这对您的xml文件的外观有几个假设,并不是在所有情况下都能工作。
发布于 2016-05-17 18:31:15
现在,我已经找到了一种使用xml.dom.minidom完成这项工作的简单方法
import xml.dom.mimidom as DM
tree = DM.parse(xml_file)
paragraphs = tree.getElementByTagName('paragraph')
print(len(paragraphs))https://stackoverflow.com/questions/37266090
复制相似问题