在BeautifulSoup对象中使用\n清理表格

、

我从一个beautifulSoup对象中提取了一个表，该对象的开头为 <html><body><p>{"datasets":{"cf":"</p><table class="fs-table" id="cf-table">\n <tbody>\n <

浏览 48提问于2019-03-31得票数 1

回答已采纳

1回答

我在数据清理方面有一些问题

、、、

我已经从维基百科页面上抓取了一个表格，接下来我将清理数据。我已经将数据转换为Pandas格式，现在我在清理数据时遇到一些问题import requestswebsite_url"Not assigned“值：但它显示：“‘未赋值’在轴中找不到” 以下是我

浏览 2提问于2019-04-08得票数 0

1回答

无法将一些表格内容写入文本文件

、、

我用python编写了一个脚本，以便从网页中获取一些表格内容，我的脚本可以相应地解析它们。但是，问题是我不能将它们写入文本文件。我试过：from bs4 import BeautifulSoup soup = BeautifulSoup(res

浏览 1提问于2019-08-12得票数 0

2回答

BeautifulSoup无法从wiki中提取表

、、

当我检查桌子的时候因此，我在Python中尝试了以下方法：x = bs.BeautifulSoup(r.content) x.find_all

浏览 0提问于2018-02-25得票数 1

回答已采纳

1回答

BeautifulSoup从列表中删除带有<br/>标记的项

、、、、

我有一个BeautifulSoup对象(网页)，我已经磨练了一个感兴趣的HTML段落。它里面有几个项目，我想清理垃圾(除了文字以外的任何东西)。在调用段落的内容属性(例如paragraph_name.contents)后，我在列表中获得了段落中的条目，但需要帮助清除列表中带有HTML标记的项目。Year Founded: 1999', u'\n', <spa

浏览 3提问于2017-11-13得票数 0

回答已采纳

2回答

使用BeautifulSoup访问html中的文本

、

我试图使用Out of Stock访问字符串BeautifulSoup，但找不到方法： <span style="color: #727272; font-size: 14px; font-weight

浏览 3提问于2015-06-07得票数 0

回答已采纳

1回答

从html中提取表数据，其中使用python将行存储在div中。

、

我正在尝试从一个网站中提取一些数据，使用漂亮的汤，特别是一个表，其中表和行存储在div标记中，而不是通常的表标记中。这意味着我不能使用pandas read_html函数来简单地提取所有的表。| 1 |有没有一种简单的方法，使用

浏览 2提问于2021-05-14得票数 0

1回答

如何去除第二层的空隙？

、

我正在尝试删除第二个alinea中的额外空间和"rebtel.bootstrappedData“，但由于某种原因，它无法工作。afghanistan/","popular":false},{"iso2":"AL","route":"albania","name":"Albania","url":"/en/rates/albania/ 这是我

浏览 4提问于2022-11-21得票数 0

回答已采纳

1回答

BeautifulSoup 如何获取href？

我正在学习python在list_item_area表格下面有N个<div class="list_item">表格我想获取<dt>中的href，但是只能获取到dt这一层，希望前辈能指点一下。微信图片_20201130121815.png from

浏览 516提问于2020-11-30

1回答

如何对表格中链接中的图像进行网络抓取？

、、

我们需要从表格的链接中获取图像。有一张表，里面有一个链接en，在那个链接里都是图片。获取网站所有图片的最好方法是什么？但是我们如何获得这个网站的图片呢？from bs4 import BeautifulSoup page =

浏览 1提问于2016-04-05得票数 1

1回答

BeautifulSoup:是否将所有p个元素合并为一个字符串？

、、

我目前使用下面的Python代码摘录来获取所有def scraping(url, html): soup = BeautifulSoup(html,""", ""And then there are other variations \n\nLooks like there are some non-text elements.\n\xa0""]" ... 有没有可能获得内容清理</e

浏览 0提问于2018-10-17得票数 0

1回答

在corona中清理表格

、、

我在清除LUA表中的数据时遇到了问题。我使用场景插件，只要玩家前进到下一个场景，我就想重置表格中的数据。我使用这个函数来创建游戏元素： local originX = 0 endend 当我移动到下一个场景时，我尝试了所有这些选项来<e

浏览 0提问于2013-07-02得票数 0

回答已采纳

1回答

如何清除google电子表格中的所有单元格(并更改上次编辑的列)

、、

对于我构建的脚本，我有一个表单，需要“清理”每个"n时间“，删除所有响应，还需要清除它绑定的电子表格。form.deleteAllResponses();然而

浏览 1提问于2017-09-19得票数 1

1回答

我正在尝试抓取这个网站(底部表格)的https://www.eia.gov/dnav/ng/hist/rngwhhdD.htm，到目前为止我已经得到了代码。我需要帮助清理抓取的数据。(我只需要文本和删除HTML代码/标签) (下面的代码是works) (我是在Jupyter notebook btw中这样做的) 我一直在尝试".text“和".strip”，但到目前为止还没有成功。import bs4 from ur

浏览 19提问于2019-10-05得票数 0

回答已采纳

3回答

Python抓取--当页面通过JS加载内容时，如何用漂亮的汤获取资源？

、、、

因此，我试图使用BeautifulSoup和urllib从特定的网站中抓取一个表。我的目标是从这个表中的所有数据创建一个列表。我试过使用来自其他网站的表格来使用相同的代码，而且它工作得很好。但是，在尝试使用此网站时，该表返回一个NoneType对象。有人能帮我吗？我试过在网上寻找其他答案，但运气不太好。下面是代码：import urllib from bs4 import

浏览 5提问于2015-04-20得票数 6

回答已采纳

2回答

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

我在数据清理方面有一些问题

无法将一些表格内容写入文本文件

BeautifulSoup无法从wiki中提取表

BeautifulSoup从列表中删除带有<br/>标记的项

使用BeautifulSoup访问html中的文本

从html中提取表数据，其中使用python将行存储在div中。

如何去除第二层的空隙？

BeautifulSoup 如何获取href？

如何对表格中链接中的图像进行网络抓取？

BeautifulSoup:是否将所有p个元素合并为一个字符串？

在corona中清理表格

如何清除google电子表格中的所有单元格(并更改上次编辑的列)

如何在没有HTML/标签的文本中清理我的数据？

Python抓取--当页面通过JS加载内容时，如何用漂亮的汤获取资源？

*将html保存为文本

无法使用漂亮的汤刮除表中的所有行

如何使用BeautifulSoup在标记之间刮取嵌套文本？

bs4汤对象是否可以与lxml一起使用？

Python:构建在BeautifulSoup中的函数

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐