BeautifulSoup4获取"li a“，其中li中没有文本

BeautifulSoup4是Python中一个用于解析HTML和XML的库，它提供了一种简单的方式来从网页中提取数据。在这个问答中，我们要使用BeautifulSoup4来获取带有"li a"标签的元素，其中li标签中没有文本。

答案如下：

BeautifulSoup4是一个Python库，用于解析HTML和XML文档。它提供了一种简单的方式来从网页中提取数据。在这个问题中，我们想要获取带有"li a"标签的元素，其中li标签中没有文本。

下面是使用BeautifulSoup4获取符合条件的元素的示例代码：

from bs4 import BeautifulSoup

html_doc = """
<html>
<body>
<ul>
  <li><a href="link1">Link 1</a></li>
  <li><a href="link2"></a></li>
  <li><a href="link3">Link 3</a></li>
</ul>
</body>
</html>
"""

soup = BeautifulSoup(html_doc, 'html.parser')
elements = soup.select('li:not(:has(> a:empty)) a')

for element in elements:
    print(element['href'])

这段代码的作用是从给定的HTML文档中获取带有"li a"标签的元素，其中li标签中没有文本。具体的实现过程如下：

首先，我们导入BeautifulSoup库，并定义了一个包含HTML文档的字符串变量html_doc。
然后，我们使用BeautifulSoup的构造函数来创建一个BeautifulSoup对象soup，将html_doc作为参数传入。我们还指定了解析器为'html.parser'。
接下来，我们使用soup的select方法来选择符合条件的元素。我们使用CSS选择器的语法来指定选择条件，即选择带有"li a"标签的元素。通过:not(:has(> a:empty))选择条件，我们排除了那些li标签中包含空的a标签的情况。
最后，我们使用一个循环来遍历获取到的元素，并输出它们的href属性。

这样，我们就能够获取到符合条件的元素了。

推荐的腾讯云相关产品和产品介绍链接地址：

腾讯云对象存储（COS）：用于存储和管理大规模的非结构化数据。详情请参考：https://cloud.tencent.com/product/cos
腾讯云云服务器（CVM）：提供基于云的弹性计算服务，满足各种规模和业务需求。详情请参考：https://cloud.tencent.com/product/cvm
腾讯云容器服务（TKE）：用于管理容器化的应用程序，提供弹性、高可用的容器运行环境。详情请参考：https://cloud.tencent.com/product/tke

请注意，以上推荐的产品和链接是腾讯云的产品，仅供参考和了解使用场景，并不代表其他品牌商的产品。

页面内容是否对你有帮助？

有帮助

没帮助

BeautifulSoup4获取"li a“，其中li中没有文本

、、

网站的结构是这样的 <li> <a href="#">1st link</a><li></li> This also has a link <a href="#"&

浏览 11提问于2019-02-27得票数 0

回答已采纳

2回答

在Python中获取特定标记之外的数据

、

我在BeautifulSoup4中使用Python3.8。我在Windows 10上，我使用PyCharm。<ul> <span class="def">Achenheim</span> (Région</ul> </<em

浏览 8提问于2022-09-12得票数 2

回答已采纳

2回答

Xpath选择特定的列表元素

、

嘿，我有下面的html：<ul><li>211 600</li><li><strong>Fax:</strong></li>

浏览 3提问于2017-01-29得票数 1

回答已采纳

3回答

jQuery前置开始标记附加结束标记

、、、

我有一些无法更改的标记，我需要将所有内容都包装在<li>中。这就是我想要做的：$('nav[role="breadcrumb"] ul a').wrap('<li></li>'); $('

浏览 0提问于2012-09-20得票数 0

回答已采纳

3回答

XPath捕获特定的<li>文本值，但不捕获其子元素

、、、

在这里，我想捕捉一些特定的文本值，这些文本值已经非常复杂地存储在DOM中。我是XPath的新手，我已经了解了它的基本知识和其他一些问题，但无法解决这个问题。我将用2张图片来解释这个问题。<sup></sup> <li>...</li> 因此，正如您在上面看到的，li标记的动态数量之间的文本。这里需要的是没

浏览 4提问于2018-01-08得票数 0

回答已采纳

1回答

如何使用正则表达式来剪切放置在两个单词之间的文本？

、

我是正则表达式的初学者，我想剪切一些放在两个单词之间的文本。我正在使用QT来做这件事。下面是一些例子：Feels like <i><span class="wx-value" itemprop="feels-like-temperature-fahrenheit">55</span>°</i> 我想让Fe

浏览 1提问于2013-06-01得票数 0

回答已采纳

4回答

使用JQuery构建快速搜索框

、、、

我有以下标记：<ul id="comboBoxData"> <li>12</li><li>123</li> <li>1234</<

浏览 6提问于2012-05-21得票数 2

回答已采纳

3回答

在Prototypejs中，jQuery函数的等效性是什么？

、

什么是jQuery的以及html()函数在prototypeJS中？

浏览 5提问于2010-02-10得票数 0

回答已采纳

2回答

从带有javascript的列表中选择一项

、、

我需要搜索并选择这个列表中的一个项目，但是我无法选择它。我可以找到它，但不能选择元素。请帮帮我，非常感谢 var input = document.evaluate("//li[contains(., 'ATACAMA')]", document, null, XPathResult.ANY_TYPE

浏览 5提问于2022-06-14得票数 0

回答已采纳

2回答

从<li>获取文本

、、、

我在<div>中有一些<li>标记，如下所示：<li> <a href="link2"> two <li>如何使用HTML DOM解析器获取<

浏览 0提问于2012-05-04得票数 1

回答已采纳

2回答

获取<li>文本内容

我在<li>中嵌套了控件(输入和选择)：更改控件时，我需要读取属性名称，即<li>文本内容，但在上述情况下(使用select) li.textContent检索以

浏览 4提问于2016-02-07得票数 0

回答已采纳

1回答

将包含HTML的字符串转换为实际HTML

、、

设置我需要在HTML中获取文本。</li>\n</ul>\n</div>\n<p>[/vc_column_text]</p>

浏览 0提问于2018-05-02得票数 0

回答已采纳

1回答

如何通过单击事件向输入框添加文本？

、

具体来说，我想在搜索中添加流行的关键字，用户可以通过单击关键字将文本添加到搜索框中。下面是一个例子。 $('#searchHot li').click(function() { <input type="search">

浏览 5提问于2021-10-06得票数 1

回答已采纳

2回答

jQuery获取项目父级

、、

我正在尝试使用以下代码获取项目的父项。例如。在下面的示例中，"Item 1.1“的父项将是"Item 2”。项目： <li><div>Item 1</div></li><li><div>Item 2<&#x

浏览 0提问于2010-09-06得票数 3

回答已采纳

1回答

Web抓取到html中的一个特定点，然后停止

、、、

我正在刮李标签，想在html中的一个特定位置停下来。我不希望html中在这一点之后的li标记。我是usnigpython3.7，beautifulsoup4，下面是一个到示例站点数据<li class="s-item" data-view="mi:168

浏览 2提问于2020-06-09得票数 2

回答已采纳

3回答

如何从有序列表创建数组/对象？

示例列表： <li>First list item</li> <li>Third list item</li>应导致

浏览 3提问于2022-07-20得票数 0

回答已采纳

4回答

获取li的文本值(嵌套项中没有文本)

、、

<ul> <li class="item-ii">AII <li class="item-a">A</li> <li class="item-b"

浏览 0提问于2011-01-07得票数 5

回答已采纳

3回答

基于文本内容筛选jquery对象中的元素

、、、、

JS var check=$('ul').find('li').filter(function(){ }) <li id="one">one</li> <li i

浏览 1提问于2013-08-19得票数 2

回答已采纳

1回答

CSS选择器:没有任何子元素的元素

、、

我有一个嵌套的无序列表，其中有一个由标识符定义的"li“元素: data-main。1(必须选择) <ul> <ul><li>1.1</li> <

浏览 1提问于2016-03-04得票数 6

回答已采纳

3回答

更改jQuery加载代码

、、

我正在尝试删除href page#.html加载，并在单击链接时使用带有文本的预加载li来填充sclit div。<!para">Sci Lit 2</a>--> <ul style="display:none"

浏览 2提问于2011-05-23得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

BeautifulSoup4获取"li a“，其中li中没有文本

相关·内容

BeautifulSoup4获取"li a“，其中li中没有文本

在Python中获取特定标记之外的数据

Xpath选择特定的列表元素

jQuery前置开始标记附加结束标记

XPath捕获特定的<li>文本值，但不捕获其子元素

如何使用正则表达式来剪切放置在两个单词之间的文本？

使用JQuery构建快速搜索框

在Prototypejs中，jQuery函数的等效性是什么？

从带有javascript的列表中选择一项

从<li>获取文本

获取<li>文本内容

将包含HTML的字符串转换为实际HTML

如何通过单击事件向输入框添加文本？

jQuery获取项目父级

Web抓取到html中的一个特定点，然后停止

如何从有序列表创建数组/对象？

获取li的文本值(嵌套项中没有文本)

基于文本内容筛选jquery对象中的元素

CSS选择器:没有任何子元素的元素

更改jQuery加载代码

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐