我使用PyQuery来处理这个超文本标记语言:
<div class="container">
<strong>Personality: Strengths</strong>
<br />
Text
<br />
<br />
<strong>Personality: Weaknesses</strong>
<br />
Text
<br />
<br />
</div>现在我已经获得了一个指向.container的变量e指针,我将遍历它的子对象:
for c in e.iterchildren():
print c.tag但在这种情况下,我无法获得文本节点(两个Text字符串)
如何循环包含文本节点的元素的子元素?
发布于 2019-03-05 20:30:08
你可以像这样做
for c in e.children():
p = PyQuery(c)
print p.__str__()
#here re.sub remove html tag这段代码可以获得每个节点的原始文本。如果要将文本标记与其他文本标记区分开来:
raw = p.__str__().strip()
a = raw.rfind(">")
if (a+1!=len(raw)) :
print 'is text'https://stackoverflow.com/questions/28833947
复制相似问题