首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >可以找到所有<a href>的特定锚文本

可以找到所有<a href>的特定锚文本
EN

Stack Overflow用户
提问于 2012-11-06 05:30:20
回答 1查看 48.6K关注 0票数 21

我正在尝试使用漂亮的汤来解析html,并找到所有带有特定锚点标签的href。

代码语言:javascript
复制
<a href="http://example.com">TEXT</a>
<a href="http://example.com/link">TEXT</a>
<a href="http://example.com/page">TEXT</a>

我正在寻找的所有链接都有完全相同的锚文本,在这种情况下文本。我不是在找TEXT这个词,我想用TEXT这个词来找出所有不同的HREF

编辑:

对于查找类似于使用类解析链接的内容的说明

代码语言:javascript
复制
<a href="http://example.com" class="visible">TEXT</a>
<a href="http://example.com/link" class="visible">TEXT</a>
<a href="http://example.com/page" class="visible">TEXT</a>

然后使用

代码语言:javascript
复制
findAll('a', 'visible')

除了我正在解析的HTML没有类,但始终具有相同的锚文本

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2012-11-06 05:35:31

像这样的东西可以工作吗?

代码语言:javascript
复制
In [39]: from bs4 import BeautifulSoup

In [40]: s = """\
   ....: <a href="http://example.com">TEXT</a>
   ....: <a href="http://example.com/link">TEXT</a>
   ....: <a href="http://example.com/page">TEXT</a>
   ....: <a href="http://dontmatchme.com/page">WRONGTEXT</a>"""

In [41]: soup = BeautifulSoup(s)

In [42]: for link in soup.findAll('a', href=True, text='TEXT'):
   ....:     print link['href']
   ....:
   ....:
http://example.com
http://example.com/link
http://example.com/page
票数 42
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/13240700

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档