PYTHON - BEAUTIFULSOUP如何将空TD(表数据)作为空值而不是跳过

BeautifulSoup是一个Python库，用于从HTML或XML文件中提取数据。它提供了一种简单而灵活的方式来遍历解析文档树，并提取所需的数据。

在处理空TD（表数据）时，BeautifulSoup默认会跳过它们。如果我们想将空TD作为空值而不是跳过，可以使用以下方法：

首先，我们需要导入BeautifulSoup库：

from bs4 import BeautifulSoup

然后，我们可以使用BeautifulSoup解析HTML文件：

html = """
<table>
  <tr>
    <td>Value 1</td>
    <td></td>
    <td>Value 3</td>
  </tr>
</table>
"""

soup = BeautifulSoup(html, 'html.parser')

接下来，我们可以使用find_all方法找到所有的TD元素，并遍历它们：

td_elements = soup.find_all('td')

for td in td_elements:
    if td.string is None:
        td.string = ''  # 将空TD的内容设置为空字符串

在上面的代码中，我们使用了find_all方法来找到所有的TD元素，并使用循环遍历它们。如果TD元素的内容为None，即为空TD，我们将其内容设置为空字符串。

现在，我们可以打印出修改后的HTML内容：

print(soup.prettify())

输出结果如下：

<table>
  <tr>
    <td>Value 1</td>
    <td></td>
    <td>Value 3</td>
  </tr>
</table>

可以看到，空TD的内容已经被设置为空字符串。

这是使用BeautifulSoup将空TD作为空值而不是跳过的方法。关于BeautifulSoup的更多信息和用法，请参考腾讯云的相关产品和产品介绍链接地址。

PYTHON - BEAUTIFULSOUP如何将空TD(表数据)作为空值而不是跳过

、、、、

我想把一个网页抓取成一个4列的csv文件，有些表格数据不包含数据，我想把它写出来作为一个空的单元格值，而不是用.text跳过它。href>，则附加<a>标记数据，如果没有，则附加<td>中的内容，但如果<td>没有数据，则将其写为空(或文本"None")值。from urllib.re

浏览 23提问于2020-08-21得票数 1

回答已采纳

1回答

在python 3中一列(td)为空时如何跳过HTML表行(tr)

、

我正在从HTML表中抓取数据，一旦我使用BeautifulSoup获得了HTML数据，我就会从列中生成一个浮动列表。它工作得很好，但是当有一个空单元格时，它就会掉下来，因为我的计算结果不同步--例如，listn与listn+2比较。这是我用来生成成对值列表的代码(这些值以字符串分数开始，然后转换为floats)： amounts = table_body.find_all('td', attrs={'class'

浏览 24提问于2016-11-14得票数 0

回答已采纳

1回答

如何使用BeautifulSoup从表中获得第一个和第三个td？

、、、、

我目前正在使用Python和BeautifulSoup来抓取一些网站数据。我试图从格式化如下的表中提取单元格：

浏览 0提问于2013-08-14得票数 6

回答已采纳

1回答

嵌套的for循环并附加到空对象

、

我提供了一个网站过滤器的值，以便生成不同的html，l解析。我希望将每个页面源代码保存到不同的Python对象，以便区分数据。我有一个空对象的列表，l将追加到这个列表中。解析页面源代码，并希望将每个页面源代码保存到其自己的Python对象中，该对象本身位于列表中。以这种方式html = browser.page_source soup = <e

浏览 7提问于2016-09-16得票数 0

1回答

通过文本文件将NULL插入为DB null

、、、

同时，将文本文件从、pyspark、、shell插入到组表。如果我查询单元表，只能使用筛选条件= 'NULL'而不是is null重试记录。有谁能建议如何将数据作为DB NULLS插入表中？

浏览 2提问于2020-05-26得票数 0

回答已采纳

1回答

如何使用BeautifulSoup清除隐藏的数据元素

、

Level2StockQuotes.com提供了免费的实时顶级引用，我想用BeautifulSoup用python捕获这些引用。问题是，即使我可以在浏览器检查器中看到实际的数据值，我也不能将这些值抓取到python中。

浏览 0提问于2019-08-13得票数 0

3回答

从html文件中导入表的行作为python中的列表

、、、

我是一名python新手，我遇到了一些我无法解决的问题(即使在谷歌上搜索了大约一百万次)。我有超过100个html文件，每个文件中都有几个表。最终，我希望将文件中第一个HTML表的每一行作为python中的列表，但不使用HTML标记。对于第一步，我正在尝试找出如何摆脱HTML标记，然后我需要找出如何将其作为列表导入。>20</td><td>60.11</td&

浏览 3提问于2013-02-20得票数 2

回答已采纳

2回答

用于获取onclick值的Python

、、

我正在使用Python和BeautifulSoup为我的一个小项目抓取网页。该网页有多个条目，每个条目在HTML中由一个表行分隔。我的代码部分工作，但是很多输出都是空的，它不会从网页中获取所有结果，甚至不会将它们收集到同一行中。class=channel>Title</td><td class=channel>Date</td><td class=channel>Time<

浏览 1提问于2014-12-11得票数 1

回答已采纳

1回答

美丽的汤-刮掉空值

、、

我有一些Python代码，它将特定赛季的NBA球员的游戏日志(例如：)抓取到一个csv文件中。我用的是美汤。www.basketball-reference.com/players/a/abdelal01/gamelog/1991/"问题是:从查看URL元素可以看出，表中的一些单元格具有空值<td class="right " data-stat="fg3_pct

浏览 1提问于2018-07-21得票数 0

回答已采纳

2回答

SQL查询在开始和结束null之间获取数据

在某些项目中，我需要从一个表中选择在空值之后开始的顶级值，而不是一些空值和进一步的数据。假设表名是数据，其中有一个名为Company的列

浏览 0提问于2014-05-27得票数 1

回答已采纳

1回答

Scraperwiki - python -跳过表行

、、

我正在尝试抓取一个表，该表使用TH作为前导列元素，并带有以下TD标记。问题是该表使用需要跳过的间歇分隔符，因为它们不包含TH标记。这是表中的一个示例：<tr><t

浏览 6提问于2014-05-14得票数 2

回答已采纳

1回答

BeautifulSoup findall返回空列表

、、

所以我是python的新手，我正在尝试使用bs4和urllib从iso-ne.com/isoexpress/获取表中的数据。这是我到目前为止所知道的：from urllib import urlopenhtml=urlopen(website).read().decode('utf-8

浏览 0提问于2015-02-25得票数 2

2回答

BeautifulSoup -将HTML表转换为CSV并获取一列的href

、、、

我正在用下面的代码抓取一个HTML表：import urllib2 try: finally: soup=BeautifulSoup(html) for tr in soup.find_all(

浏览 0提问于2015-01-15得票数 5

回答已采纳

1回答

Dojo1.9如何将空白<td>添加到dojox/layout/TableContainer中？

、

我如何在dojo TableContainer中添加一个空的TableContainer？>widget2</td> </tr>如何将第三组<td>作为空

浏览 5提问于2014-04-22得票数 0

回答已采纳

1回答

如何从SQLite表返回实值

、、

我这样做是通过将数据存储在标有买卖价格的表格中。如果我把它们分开运行，它们就能正常工作。但第二次，我把他们放在同一个程序，他们不工作。我需要能够从列表中的每三个值中计算一个趋势，因为这是每只股票的记录数，但它们都被放入一个列表中。

浏览 3提问于2017-01-15得票数 2

回答已采纳

1回答

jQuery模板忽略String.Empty值

、、

我有一个ASP .Net .Net服务，它返回一个类似于System.Data.DataTable的对象(包含行和列，单元格值是字符串)，它被序列化为JSON。我希望使用这个数据表JSON结果来使用jQuery模板填充一个HTML。如果一行包含一个空单元格(String.Empty)，我仍然希望它打印<td></td>，否则我的表结构就会混乱。jQuery模板似乎将String.Empty视为null，并跳过它，<e

浏览 3提问于2011-09-30得票数 2

回答已采纳

1回答

这两个Postgres查询的区别是什么？

from table and time > '2013-12-31' 然后显式地计算sum(a)-sum(b)的值。

浏览 4提问于2014-01-26得票数 0

回答已采纳

1回答

代码优先迁移:默认值为空Guid的外键

、、、

由于这些查找表必须始终使用已选中的默认值加载，因此这些查找表中有一个值将始终以Guid.Empty值(00000000-0000-0000-0000-000000000000)作为其主键，以便很容易地将其标识为默认值我正试图找到一种方法，使使用这两个查找表的外键默认为空Guid，如果它们被传递为空值。这是一种额外的保险，以防我错过了代码本身的一个位置，在这里我应该用一个空的Guid

浏览 3提问于2016-07-21得票数 0

回答已采纳

1回答

使用BeautifulSoup抓取表

、、

我有以下类型的页面，我想从其中收集最后一个表中的信息(如果您一直向下滚动，它就是标签为“Procedure”的框中的页面)： <tbody><tr class="doc_title>

浏览 1提问于2010-07-02得票数 3

回答已采纳

1回答

skipNul = TRUE在read.table()和read.csv()中做了什么(除了跳过/忽略嵌入的空值之外)？

、、、

我认识到在skipNul = TRUE中设置read.csv()，read.table()跳过/忽略“嵌入的空值”(参见?read.csv和)。跳过/忽略嵌入的空值对R中的结果数据意味着什么?我想R的“跳过”或“忽略”意味着它们作为文本字符串保存，而理想情况下，它们将显示为NA值，但na.strings参数不足以捕获它们。

浏览 2提问于2016-04-25得票数 3

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

PYTHON - BEAUTIFULSOUP如何将空TD(表数据)作为空值而不是跳过

相关·内容

PYTHON - BEAUTIFULSOUP如何将空TD(表数据)作为空值而不是跳过

在python 3中一列(td)为空时如何跳过HTML表行(tr)

如何使用BeautifulSoup从表中获得第一个和第三个td？

嵌套的for循环并附加到空对象

通过文本文件将NULL插入为DB null

如何使用BeautifulSoup清除隐藏的数据元素

从html文件中导入表的行作为python中的列表

用于获取onclick值的Python

美丽的汤-刮掉空值

SQL查询在开始和结束null之间获取数据

Scraperwiki - python -跳过表行

BeautifulSoup findall返回空列表

BeautifulSoup -将HTML表转换为CSV并获取一列的href

Dojo1.9如何将空白<td>添加到dojox/layout/TableContainer中？

如何从SQLite表返回实值

jQuery模板忽略String.Empty值

这两个Postgres查询的区别是什么？

代码优先迁移:默认值为空Guid的外键

使用BeautifulSoup抓取表

skipNul = TRUE在read.table()和read.csv()中做了什么(除了跳过/忽略嵌入的空值之外)？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐