from xml.dom.minidom import parseString
dom = parseString(data)
data = dom.getElementsByTagName('data')
'data‘变量以element对象的形式返回,但我无法在文档中看到获取该元素的文本值。
例如:
<something><data>I WANT THIS</data></something>
有谁有什么想法吗?
发布于 2009-09-16 08:09:14
这应该能起到作用:
dom = parseString('<something><data>I WANT THIS</data></something>')
data = dom.getElementsByTagName('data')[0].childNodes[0].data
也就是说,您需要更深入地研究DOM结构,以获取文本子节点,然后访问它的值。
发布于 2009-09-16 08:10:41
所以看待它的方式是“我想要这个”实际上是另一个节点。它是"data“的一个文本子元素。
from xml.dom.minidom import parseString
dom = parseString(data)
nodes = dom.getElementsByTagName('data')
此时,"nodes“是一个数据,在您的示例中,它有一个项目,即”NodeList“元素。相应地,"data“元素也只有一个子节点,即文本节点"I WANT THIS”。
所以你可以这样做:
print nodes[0].firstChild.nodeValue
请注意,如果您的输入中有多个名为"data“的标记,则应该对”节点“使用某种迭代技术,而不是直接对其进行索引。
https://stackoverflow.com/questions/1433907
复制