在html/css页面上使用python和BeautifulSoup时，访问表中没有ID或类的<td>元素

在HTML/CSS页面上使用Python和BeautifulSoup时，如果要访问表中没有ID或类的<td>元素，可以使用BeautifulSoup的选择器来定位和提取这些元素。

首先，导入BeautifulSoup库并使用requests库获取HTML页面的内容：

import requests
from bs4 import BeautifulSoup

url = "http://example.com"  # 替换为实际的页面URL
response = requests.get(url)
html_content = response.text

接下来，使用BeautifulSoup解析HTML内容，并使用选择器定位<td>元素：

soup = BeautifulSoup(html_content, "html.parser")

td_elements = soup.select("td")

上述代码中的"td"是CSS选择器，它表示选择所有的<td>元素。使用select()方法可以返回一个包含所有匹配元素的列表。

如果要进一步处理这些<td>元素，可以遍历列表并提取所需的信息：

for td in td_elements:
    # 处理每个<td>元素的代码
    # 可以提取文本内容、属性等
    text = td.get_text()
    attribute = td["attribute_name"]
    # ...

在处理<td>元素时，可以使用get_text()方法获取元素的文本内容，使用字典索引的方式获取元素的属性。

对于没有ID或类的<td>元素，可以使用其他属性或父元素的选择器来进一步定位和提取。例如，如果要选择某个特定的<table>元素下的<td>元素，可以使用父元素的选择器和子元素的选择器的组合：

table = soup.select_one("table#table_id")  # 替换为实际的table ID选择器
td_elements = table.select("td")

上述代码中的"table#table_id"表示选择ID为"table_id"的<table>元素。

关于BeautifulSoup的更多用法和功能，请参考腾讯云的相关产品和产品介绍链接地址：BeautifulSoup产品介绍。

页面内容是否对你有帮助？

有帮助

没帮助

在html/css页面上使用python和BeautifulSoup时，访问表中没有ID或类的<td>元素

、、、、

我正在使用Selenium、Python和Beautiful Soup抓取页面，并且希望将表中的行以逗号分隔值的形式输出。不幸的是，页面的HTML到处都是。到目前为止，我已经通过使用元素的ID成功地提取了两列。其馀的值只是包含在中，没有标识符，如class或id。以下是结果示

浏览 12提问于2016-07-27得票数 0

2回答

如何通过beautifulsoup4中的文本内容获取标记元素

、、

我不得不从1000个站点中删除数据，本地的HTML文件，复杂的是这些站点就像90年代的结构，几乎相同的嵌套表结构，没有id的没有CSS类的嵌套表，我如何在一个tr标记中选择文本中的特定表基。XPath不是一个解决方案，因为这些站点主要是相同的结构，但并不总是具有相同的

浏览 6提问于2017-01-11得票数 0

回答已采纳

3回答

创建垂直折叠和展开的html表

、、、

我有一个php脚本，它读取一个文件并生成一个多页的表集合，这样就可以轻松地读取。是否有任何方法使每个表折叠，点击一个小按钮，只留下标题栏为该表？谢谢!

浏览 2提问于2014-07-15得票数 0

回答已采纳

5回答

如何链接和应用外部css文件

、

我有一个名为tablecellmembers.css的css文件( .aspx文件中还没有链接吗？)其中包括： border-collapse: collapse; border-top-width: 5px;} 然后，我在.cs文件中动态创建了一个表格、表格行和表格单元格。TableCell tc = n

浏览 0提问于2013-01-29得票数 0

回答已采纳

2回答

为html表中所有类似的tds设置样式参数

、、

我试图为html表中的所有to设置类似的样式，如下所示：<tbody><td style="text-align: right; direction: ltr;">1</td> <td style="text-align: right; direction: ltr;">2</td>

浏览 3提问于2015-03-07得票数 0

回答已采纳

3回答

使用Python在网页表中的最后一个超链接

、、、

我正在使用Beautifulsoup4解析一个网页。类似于Bing的工作方式，如果您输入一个搜索项，它将返回前十次点击和随后的页面上列出的第2页，第3页等.查询后返回的第一页确实包含从第2页到最后一页的超链接。我想要确定的正是最后一页的内容。例如，第87页)。下面是页面<e

浏览 6提问于2015-03-08得票数 1

回答已采纳

2回答

JQuery悬停仅显示多个元素的第一个隐藏区域

、、

我正在从数据库中拉出标题和描述，我希望当标题悬停在上方时弹出描述。由于某种原因，当我将鼠标悬停在任何一个链接上时，相同的描述都会不断弹出。我不知道我做错了什么！ php如下： <?php foreach ($updateInfo['updates'] as $update) { echo "</td><td>". $update['fldLeadText'].&#

浏览 16提问于2020-07-29得票数 0

2回答

使用Python阅读网页

、

我正在尝试读取和处理Python中的一个网页，其中的代码行如下： <div class="or_q_tagcloud" id="tag1611"></div></td></tr/release/album/ac_dc/live_f5/" class="album&

浏览 0提问于2010-08-09得票数 0

回答已采纳

1回答

如何访问cheerio中的表元素？

、、

除了值以外，元素没有类、ids或任何东西。它们只应用样式，但在元素中使用。剩下的是TD和TR。现在在Python和BeautifulSoup4中，我可以这样做： status = soup.select('.(其中是TD )并访问它们。现在，我在“啦啦队”中尝试了几乎相同的<

浏览 2提问于2017-06-02得票数 1

回答已采纳

1回答

使用Python* -循环查找城市名称，单击并获取感兴趣的值*

、

这是我第一次使用Python和web抓取。一直在四处张望，仍然无法得到我需要做的事情。正如你所看到的，这是从下拉的‘公寓’。我尝试做的第一步是从下拉列表中获取城市列表。然后，我的第二步是，从给定的城市列表中，转到每个城市(例如.url./Brant

浏览 4提问于2016-06-22得票数 0

回答已采纳

2回答

解析<TR> </TR>标记并使用BeautifulSoup打印元素

、、

我是Python新手，目前正在解决问题，以提高我的编码技能。我已经使用python提交了一个表单，从提交表单后显示的下一页开始，我希望收集一些数据并将其显示在输出中。我想要收集的数据是在<TR> </TR>标记之间，并且在页面中有很多类似的<TR> </TR>。，我想要读取名称THE_ROCK (它存在于上面的want标记中

浏览 1提问于2016-02-27得票数 1

回答已采纳

4回答

初学者的ASP.NET MVC5和DataTables :哪里去了？

、

因此，当我发现文档中写着“只需添加这三行包含行和这一行JS，您就可以启动并运行”时，我认为这很简单。我照我想的做了，什么也没变。通过更多的研究，我发现了一个为MVC5和DataTables 1.10创建绑定的项目，但是说明很少(只有当你理解他们要你做的事情时，“简单”才是容易的)。我试过几个地方，但桌子没有变。我尝试的第一个地方是在第三个块的sc

浏览 2提问于2015-02-10得票数 5

回答已采纳

14回答

使用Python获取Selenium WebDriver中WebElement的HTML源代码

、、、、

我正在使用Python绑定来运行Selenium WebDriver：wd = webdriver.Firefox()elem = wd.find_element_by_css_selector('#my-id')wd.page_source 但是有没有办法获得“元素源”呢elem.source # <-- retur

浏览 353提问于2011-09-01得票数 582

回答已采纳

2回答

CSS从元素中删除所有泛型样式。

、

有什么简单的方法可以从我的元素中删除任何样式，应用于“通用”选择器吗？我的意思是section，p，div，button .基本上，它的目标不是基于类或ID的元素，而是基于实际元素本身。问题是，我在用户的网站上输出了一些HTML和CSS，但我无法控制加载在同一页面上

浏览 6提问于2020-01-21得票数 2

1回答

BeautifulSoup -如何遍历整个html页面向每个<td>添加一个类

、

我正在使用优美汤对表元素进行更改。更具体地说，我在tbody和td元素中添加了一个类。这很好，但只适用于第一个匹配元素。我不知道如何迭代页面上其余的匹配元素。soup = BeautifulSoup(combine_html, "html.parser") soup.find('tbody'

浏览 0提问于2017-11-03得票数 1

回答已采纳

3回答

在Javascript中如何缩小两个表之间的差距

、

我正在为我的ascx控件使用Javascript。我有两张桌子，一张在另一张下面。我写的代码是这样的 </table>但当我执行时，它显示它们之间几乎有2英寸的间距。能帮帮我吗？

浏览 0提问于2010-07-23得票数 2

回答已采纳

2回答

在每个打印页面上重复HTML表格页脚

、、、、

在我的身体中，我有一个表元素(如下所示)。当我想打印我的html页面时，应该在每个页面上都有和内容。页眉工作得很好，但页脚只显示在最后一页。我为这样的问题找到了许多“解决办法”，但都没有用。向元素添加或移除--样式=“显示:表-页脚-组”-什么也不做。它是导入的，只使

浏览 3提问于2017-05-12得票数 1

回答已采纳

1回答

如何运行python命令，单击页面上的每个链接并提取每个链接的标题、内容和日期？

、、、、

使用此链接：。我有一个命令，可以单击页面上的每个链接并取出所有数据，但我希望将其转换为csv文件，因此需要运行三个不同的命令，以获得页面上每篇文章的标题、段落和日期(这样它们就可以成为excel工作表中的列)。我有困难，因为这个页面没有“类”或“id”。任何建议都会很有帮助。= BeautifulSoup(requests.ge

浏览 4提问于2020-09-17得票数 1

回答已采纳

7回答

使用CSS时，如何设置单个单元格或单个列的格式？

、、

使用CSS时，如何设置单个单元格或单个列的格式？

浏览 7提问于2009-08-19得票数 2

回答已采纳

2回答

从维基百科网页中提取数据

、、、

我正试图从等公司的维基百科页面中提取员工人数。<div style="padding:0.1em 0;line-height:1.2em;&

浏览 2提问于2016-04-13得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在html/css页面上使用python和BeautifulSoup时，访问表中没有ID或类的<td>元素

相关·内容

在html/css页面上使用python和BeautifulSoup时，访问表中没有ID或类的<td>元素

如何通过beautifulsoup4中的文本内容获取标记元素

创建垂直折叠和展开的html表

如何链接和应用外部css文件

为html表中所有类似的tds设置样式参数

使用Python在网页表中的最后一个超链接

JQuery悬停仅显示多个元素的第一个隐藏区域

使用Python阅读网页

如何访问cheerio中的表元素？

使用Python* -循环查找城市名称，单击并获取感兴趣的值*

解析<TR> </TR>标记并使用BeautifulSoup打印元素

初学者的ASP.NET MVC5和DataTables :哪里去了？

使用Python获取Selenium WebDriver中WebElement的HTML源代码

CSS从元素中删除所有泛型样式。

BeautifulSoup -如何遍历整个html页面向每个<td>添加一个类

在Javascript中如何缩小两个表之间的差距

在每个打印页面上重复HTML表格页脚

如何运行python命令，单击页面上的每个链接并提取每个链接的标题、内容和日期？

使用CSS时，如何设置单个单元格或单个列的格式？

从维基百科网页中提取数据

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐