使用python BeautifulSoup，如何找到所有不带类的'a‘标签

使用Python的BeautifulSoup库可以很方便地找到所有不带类的'a'标签。下面是一个完整的示例代码：

from bs4 import BeautifulSoup

# 假设html是你要解析的HTML文档
html = '''
<html>
<body>
<a href="https://www.example.com">Link 1</a>
<a href="https://www.example.com" class="link">Link 2</a>
<a href="https://www.example.com">Link 3</a>
</body>
</html>
'''

# 创建BeautifulSoup对象
soup = BeautifulSoup(html, 'html.parser')

# 使用find_all方法找到所有不带类的'a'标签
a_tags = soup.find_all('a', class_=False)

# 遍历所有找到的标签并打印出其链接和文本内容
for a_tag in a_tags:
    print("链接:", a_tag['href'])
    print("文本内容:", a_tag.text)

上述代码中，我们首先导入了BeautifulSoup库，然后定义了一个HTML文档的字符串。接下来，我们创建了一个BeautifulSoup对象，并使用find_all方法找到所有不带类的'a'标签。最后，我们遍历所有找到的标签，并打印出它们的链接和文本内容。

推荐的腾讯云相关产品：腾讯云服务器（CVM），腾讯云对象存储（COS），腾讯云数据库（TencentDB），腾讯云人工智能（AI），腾讯云物联网（IoT），腾讯云移动开发（Mobile），腾讯云区块链（Blockchain），腾讯云元宇宙（Metaverse）。

腾讯云产品介绍链接地址：腾讯云产品

使用python BeautifulSoup，如何找到所有不带类的'a‘标签

、、

"qrs" class="sam">hi</a><a href="#9" id="abc" >hi</a> 我想为所有没有这样的NOT运算符 from bs4 import BeautifulSoup soup =

浏览 48提问于2021-04-05得票数 1

1回答

在使用Python* 3对表进行web抓取时，如何将所需数据与其所包含的HTML标记分开*

、

from urllib.request import urlopen for tr in soup.find_all('tr'):tds = tr.find_

浏览 3提问于2018-08-01得票数 0

回答已采纳

1回答

我怎样才能得到标签。按参数名计算的值？

、、

我是Python新手，我遇到了一个问题。有一个网站，该网站有一个完整的结构。我知道怎样才能找到一个div或者其他标签，但是当我找到那个标签的时候。使用类名)，我想收集所有带有值的参数，但我不能。所以，我的问题是，在我发现随机标记的所有参数和值之后，我如何收集它？我是怎么发现的 from bs4 import <

浏览 0提问于2016-12-07得票数 0

回答已采纳

6回答

使用BeautifulSoup移除所有内联样式

、、、

我正在用BeautifulSoup做一些超文本标记语言清理。对Python和BeautifulSoup都是新手。根据我在Stackoverflow上找到的答案，我已经正确地删除了标签，如下所示：但是如何删除内联样式呢？Text</p> <img class="some_image" href="somewhere.c

浏览 0提问于2012-10-19得票数 15

回答已采纳

2回答

打印不带标签的h1标题

、

使用Beautiful Soup4，我尝试打印不带标签的h1内容。 from bs4 import BeautifulSoup bs = BeautifulSou

浏览 6提问于2019-08-09得票数 0

3回答

使用BeautifulSoup从div中的所有p个元素获取文本

、、

我尝试获取给定div中所有p个元素的文本(不带标签的内容)：from bs4 import BeautifulSoup result = requests.get(url) soup = BeautifulSoupelement in

浏览 0提问于2015-10-02得票数 3

回答已采纳

1回答

使用BeautifulSoup查找具有相同CSS类的多个元素

、、

我尝试使用BeautifulSoup的find_all()来搜索具有标签"div“和类"wisbb_name”的元素。我要抓取的超文本标记语言来自。我的最终目标是根据该网站记录当天开始的所有投手的名字。投手姓名的HTML如下

浏览 19提问于2017-07-22得票数 1

回答已采纳

1回答

Python从搜索对象列表中漏掉一个元素。

、、、

我试图使用、美观汤、和requests库在Python3.7中刮取一些数据。对于该网页上的每一项(标签文章)，都有一个youtube链接。在找到文章的所有实例之后，我可以成功地提取标题。这段代码还成功地在每篇文章中找到了youtube-player类的实例，但在索引7中，输出为None。from bs4 import BeautifulSoupurl = '

浏览 7提问于2020-05-20得票数 3

回答已采纳

1回答

如何使用BeautifulSoup* bs4获取HTML的内部文本值？*

、、

在使用BeautifulSoup bs4时，如何从HTML标签中获取文本？当我运行这行代码时：我得到的title标签如下：现在我只想得到它的内部文本，page name，不带标签。如何做到这一点？

浏览 0提问于2015-01-14得票数 7

回答已采纳

1回答

Webscraping无法找到Python中的所有类

、、

我正在尝试使用bs4 Python从特定网站提取用户信息和日期，但我的代码没有从网站中找到所有的类。www.expeditionforum.com/threads/distance-indication-feature.34452/"soup = BeautifulSoupsoup.findAll('a',attrs={"class":&q

浏览 12提问于2020-03-19得票数 2

回答已采纳

5回答

BeautifulSoup:不管有多少封闭的标签，只要放在标签里面就行了

、

我正在尝试使用BeautifulSoup从网页中的<p>元素中抓取所有的内部html。有内部标记，但我不关心，我只想得到内部文本。例如，对于：<p><i>Blue</i></p><p>Light <b>green</b></p> 如何解压：

浏览 1提问于2010-06-02得票数 49

回答已采纳

4回答

我对Python了解甚少。但是我试图用一个小Python脚本在提取、转换和加载(ETL)方面实现一些目标。我得到了想要的结果，但仍然想要理解这个脚本。，soup是BeautifulSoup(html)函数返回的一个对象。我说的对吗？所以在下一条语句中，我猜table也是一个对象，这意味着我们使用find函数在soup对象中搜索一个值，并且它正在返回一个对象？请纠正我的信息，我已经了解我自己在上述代码.urlHandle是一个类，ur

浏览 6提问于2016-03-27得票数 0

1回答

当我通过类过滤通过字典搜索时，无法在漂亮的汤中找到标签

、、

下面是我的代码。')tags=soup.findAll("li",{ "class" : "list-item" }) 我希望找到所有具有class'list-item‘的'li’标签。当我执行上面的代码时，它返回一个空列表，但当我键入它为 tags=soup.findall("li","lis

浏览 6提问于2016-08-07得票数 1

回答已采纳

2回答

Python正则表达式字符串排除

、、、

使用美景汤解析源码进行抓取：print tempSitecurrentTempSite = BeautifulSoup(theTempSite) #<input

浏览 0提问于2012-01-24得票数 1

回答已采纳

2回答

lxml findall div和span标记

、、

如何使用order preserved.With BeautifulSoup找到所有的div和span标签很简单：soup.findAll(name=['span', 'div'])，但我最近切换到了lxml，因为它比BeautifulSoup快得多。

浏览 2提问于2013-03-15得票数 0

回答已采纳

2回答

自动将宽度和高度属性添加到图像标记中

、

我正在尝试编写一个脚本，自动将图像width和height添加到我的所有img中。我已经看到了这个问题：我也看过fastImage，但是它不能很好地处理Jekyll和本地文件()。你能告诉我如何做到这一点吗？

浏览 2提问于2016-06-27得票数 5

回答已采纳

3回答

Get tag的子代使用BeautifulSoup计数

、、、

我正在写一个分析工具，用来计算源代码中有多少个孩子有HTML标签。迭代所有标签的最佳方式是什么？例如，我如何获取没有任何子代的所有标记？

浏览 0提问于2016-01-11得票数 2

2回答

根据标签周围的内容查找标签(使用漂亮的汤)

、

我正在使用BeautifulSoup解析一些超文本标记语言。假设我在一个名为soup的BeautifulSoup中有以下超文本标记语言：<td>test2</td> <td class="3"><a href=href="/">test4</a></div><&#

浏览 0提问于2011-06-08得票数 0

回答已采纳

3回答

单击Python* BeautifulSoup的链接*

、、、

所以我是Python的新手(我来自PHP/JavaScript背景)，但我只是想写一个快速的脚本来爬行一个网站和所有的子页面，找到所有具有href属性的a标签，计算有多少个，然后点击链接。我可以计算所有的链接，但是我不知道如何“点击”这些链接，然后返回响应代码。(url) soup = BeautifulSoup(html_page, "html.parser"

浏览 0提问于2017-08-16得票数 2

回答已采纳

3回答

如何使用Python和BeautifulSoup在网站的超文本标记语言代码中找到特定的文本？

、、、

这里是HTML和Python的新手。我希望与Python刮一个网站，以找到拍卖数据。我想找到所有的列表与文本"lb，lbs。，磅“等。<br>Bids: 7 </div> </a> 我知道了如何使用title_all变量获取所有“ResultSet”标签的标题，但我

浏览 2提问于2020-04-20得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

使用python BeautifulSoup，如何找到所有不带类的'a‘标签

相关·内容

使用python BeautifulSoup，如何找到所有不带类的'a‘标签

在使用Python* 3对表进行web抓取时，如何将所需数据与其所包含的HTML标记分开*

我怎样才能得到标签。按参数名计算的值？

使用BeautifulSoup移除所有内联样式

打印不带标签的h1标题

使用BeautifulSoup从div中的所有p个元素获取文本

使用BeautifulSoup查找具有相同CSS类的多个元素

Python从搜索对象列表中漏掉一个元素。

如何使用BeautifulSoup* bs4获取HTML的内部文本值？*

Webscraping无法找到Python中的所有类

BeautifulSoup:不管有多少封闭的标签，只要放在标签里面就行了

理解Python代码中的类方法

当我通过类过滤通过字典搜索时，无法在漂亮的汤中找到标签

Python正则表达式字符串排除

lxml findall div和span标记

自动将宽度和高度属性添加到图像标记中

Get tag的子代使用BeautifulSoup计数

根据标签周围的内容查找标签(使用漂亮的汤)

单击Python* BeautifulSoup的链接*

如何使用Python和BeautifulSoup在网站的超文本标记语言代码中找到特定的文本？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐