问Python BeautifulSoup CSS选择器
EN

Stack Overflow用户

提问于 2017-02-26 03:11:51

回答 1查看 77关注 0票数 0

我有类似的代码，重复X次

<div class="ABC">     
    <div class="DEF"> 
        <span class="GHI">{TEXT 1}</span>
        <a href="#"><span class="{CLASS}">{TEXT 2}</span> {TEXT 3}</a>
    </div>
    <div class="DEF"> 
        <span class="GHI">{TEXT 1}</span>
        <a href="#"><span class="{CLASS}">{TEXT 2}</span> {TEXT 3}</a>
    </div>
    ...
</div>
<div class="XYZ">     
    <div class="DEF"> 
        <span class="GHI">{TEXT 1}</span>
        <a href="#"><span class="{CLASS}">{TEXT 2}</span> {TEXT 3}</a>
    </div>
    <div class="DEF"> 
        <span class="GHI">{TEXT 1}</span>
        <a href="#"><span class="{CLASS}">{TEXT 2}</span> {TEXT 3}</a>
    </div>
    ...
</div>

如何仅在父类为ABC的位置提取每个{TEXT 3}？我有一个解决方案，我美化它并获得行号，但想知道是否有更好的方法

谢谢

python

beautifulsoup

回答 1

Stack Overflow用户

发布于 2017-02-26 03:15:49

像这样的东西？

abc = soup.find('div', class_='ABC').find_all("div")
for div in abc:
    t3 = div.find('a').contents[1].strip()
    print (t3)

输出：>>>{TEXT_3} *2

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/42460438

复制

相似问题

问Python BeautifulSoup CSS选择器
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Python BeautifulSoup CSS选择器EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Python BeautifulSoup CSS选择器
EN