我有类似的代码,重复X次
<div class="ABC">
<div class="DEF">
<span class="GHI">{TEXT 1}</span>
<a href="#"><span class="{CLASS}">{TEXT 2}</span> {TEXT 3}</a>
</div>
<div class="DEF">
<span class="GHI">{TEXT 1}</span>
<a href="#"><span class="{CLASS}">{TEXT 2}</span> {TEXT 3}</a>
</div>
...
</div>
<div class="XYZ">
<div class="DEF">
<span class="GHI">{TEXT 1}</span>
<a href="#"><span class="{CLASS}">{TEXT 2}</span> {TEXT 3}</a>
</div>
<div class="DEF">
<span class="GHI">{TEXT 1}</span>
<a href="#"><span class="{CLASS}">{TEXT 2}</span> {TEXT 3}</a>
</div>
...
</div>如何仅在父类为ABC的位置提取每个{TEXT 3}?我有一个解决方案,我美化它并获得行号,但想知道是否有更好的方法
谢谢
发布于 2017-02-26 03:15:49
像这样的东西?
abc = soup.find('div', class_='ABC').find_all("div")
for div in abc:
t3 = div.find('a').contents[1].strip()
print (t3)输出:>>>{TEXT_3} *2
https://stackoverflow.com/questions/42460438
复制相似问题