我很难找到一个很好的、基本的例子来说明如何使用元素树在python中解析XML。据我所知,这似乎是用于解析XML的最简单的库。下面是我正在使用的XML示例:
<timeSeriesResponse>
<queryInfo>
<locationParam>01474500</locationParam>
<variableParam>99988</variableParam>
<timeParam>
<beginDateTime>2009-09-24T15:15:55.271</beginDateTime>
<endDateTime>2009-11-23T15:15:55.271</endDateTime>
</timeParam>
</queryInfo>
<timeSeries name="NWIS Time Series Instantaneous Values">
<values count="2876">
<value dateTime="2009-09-24T15:30:00.000-04:00" qualifiers="P">550</value>
<value dateTime="2009-09-24T16:00:00.000-04:00" qualifiers="P">419</value>
<value dateTime="2009-09-24T16:30:00.000-04:00" qualifiers="P">370</value>
.....
</values>
</timeSeries>
</timeSeriesResponse>
我可以使用硬编码的方法来做我需要的事情。但我需要我的代码更具动态性。以下是有效的方法:
tree = ET.parse(sample.xml)
doc = tree.getroot()
timeseries = doc[1]
values = timeseries[2]
print child.attrib['dateTime'], child.text
#prints 2009-09-24T15:30:00.000-04:00, 550
以下是我尝试过的几种方法,都没有成功,报告说他们找不到timeSeries (或者我尝试过的任何其他方法):
tree = ET.parse(sample.xml)
tree.find('timeSeries')
tree = ET.parse(sample.xml)
doc = tree.getroot()
doc.find('timeSeries')
基本上,我希望加载xml文件,搜索timeSeries标记,并遍历value标记,返回dateTime和标记本身的值;这是我在上面示例中所做的所有事情,但不是对我感兴趣的xml部分进行硬编码。有人能给我举一些例子,或者给我一些如何解决这个问题的建议吗?
谢谢你的帮助。使用下面的两个建议对我提供的示例文件有效,但是,它们不适用于整个文件。下面是我在使用Ed Carrel的方法时从实际文件中得到的错误:
(<type 'exceptions.AttributeError'>, AttributeError("'NoneType' object has no attribute 'attrib'",), <traceback object at 0x011EFB70>)
我认为在真正的文件中有一些它不喜欢的东西,所以我逐渐删除了一些东西,直到它正常工作。以下是我更改的代码行:
originally: <timeSeriesResponse xsi:schemaLocation="a URL I removed" xmlns="a URL I removed" xmlns:xsi="a URL I removed">
changed to: <timeSeriesResponse>
originally: <sourceInfo xsi:type="SiteInfoType">
changed to: <sourceInfo>
originally: <geogLocation xsi:type="LatLonPointType" srs="EPSG:4326">
changed to: <geogLocation>
正在删除具有“xsi:...”的属性已修复此问题。是“xsi:...”不是有效的XML?我很难通过编程的方式删除它们。有什么建议的解决方法吗?
下面是完整的XML文件:http://www.sendspace.com/file/lofcpt
当我最初问这个问题时,我并不知道XML中的名称空间。现在我知道是怎么回事了,我不需要删除"xsi“属性,它们是名称空间声明。我只是将它们包含在我的xpath搜索中。有关this page中的名称空间的更多信息,请参见lxml。
https://stackoverflow.com/questions/1786476
复制相似问题