尝试使用bs4抓取表格内容

文章/答案/技术大牛

发布

2回答

、、

所以我尝试用下面的代码抓取一个表的内容：r = requests.get(url) data

浏览 5提问于2019-07-21得票数 0

回答已采纳

2回答

使用python抓取动态javascript内容网页

、、、、

我正在尝试使用Python抓取这个网站：'‘。但是，requests + BS4只给了我HTML格式的页面源代码。我假设这是因为内容是动态的。因此，我尝试了Selenium + BS4来抓取网站，但我仍然只能抓取页面源代码。from selenium.webdriver import Firefox from bs4 import BeautifulSou

浏览 4提问于2020-02-02得票数 0

1回答

我正在尝试抓取这个网站(底部表格)的https://www.eia.gov/dnav/ng/hist/rngwhhdD.htm，到目前为止我已经得到了代码。我需要帮助清理抓取的数据。(我只需要文本和删除HTML代码/标签) (下面的代码是works) (我是在Jupyter notebook btw中这样做的) 我一直在尝试".text“和".strip”，但到目前为止还没有成功。import bs4</em

浏览 19提问于2019-10-05得票数 0

回答已采纳

2回答

Webscraping:未包含在BeautifulSoup页面中的表

、

我正试图从这个页面上的表格中抓取一张公司信息表：代码如下：from bs4 import BeautifulSoup response = requests.get("https://tools.ceres.org

浏览 3提问于2019-03-07得票数 1

回答已采纳

1回答

运行一个Flask服务器是否可以防止Node.JS中的web抓取？

、、、

我有兴趣尝试一个网络抓取项目。目标站点使用Javascript动态加载和更新内容。大多数在线讨论都表明，在尝试这样一个项目时，node.js、casper.js、phantom.js和nightmare.js都是相当流行的工具。Node.js似乎是最常用的。如果我正在运行一个烧瓶服务器，并且希望显示一个node.js的结果，例如，在我的站点上以表格格式刮擦，这是可能的吗？我会遇到兼容性问题吗？或者，为了保持一致性，我应该尝试使用基于python的方法来

浏览 6提问于2017-04-19得票数 0

回答已采纳

3回答

Python BeautifulSoup剪贴表

、、、、

我正在尝试用BeautifulSoup创建一个表格抓取。我写了这段Python代码：from bs4 import BeautifulSoup soup = BeautifulSoup(page) print i.attrs['class&#x

浏览 0提问于2013-09-24得票数 27

回答已采纳

1回答

使用BS4从python中抓取团队统计表

、、、

我正在尝试从职业足球参考中抓取一个表格，特别是来自的团队进攻表。每当我尝试下面的代码时，我都会得到一个空列表或一个NoneType。我已经抓取了其他网站，如ESPN，没有任何问题。import requests url = 'https://www.pro-football-reference.com/years/{}这个页面确实有一堆表格，所以我假设这就是为

浏览 2提问于2020-08-13得票数 1

1回答

如何在Python中对带有图片的表格进行and抓取并导出到Excel中？

、、

我正试着从URL上盗取一张桌子我可以使用Scrapestorm工具抓取表格数据。我是python的新手，不能从这个URL获取数据。from bs4 import BeautifulSoup soup = BeautifulSoup(page.text) Excel中所需的输出： e

浏览 61提问于2020-12-23得票数 1

回答已采纳

1回答

如何使用bs4从网站获取表格数据

、

我试图用bs4抓取一个网站，里面有一个表，但我得到的内容元素并不像我从inspect得到的那样完整。我在里面找不到标签<tr>和<td>。如何获取该站点的完整内容，尤其是表格的标记？下面是我的代码： from bs4 import BeautifulSoup link = requests.get("https://pemilu2019.kpu.go.idhitung-suara/"

浏览 62提问于2019-04-24得票数 1

回答已采纳

1回答

从windguru中抓取表

、、

我尝试过从中抓取表格，但我无法使用BeautifulSoup找到该表格。import requestsurl = "https://www.windguru.cz/archive.php?

浏览 2提问于2019-10-31得票数 0

5回答

Selenium WebDriver将WebElement数据追加到列表的速度非常慢

、、、

我正在尝试将webelement内容存储到python列表中。在正常工作的情况下，处理大约2,000行数据需要大约15分钟。

浏览 0提问于2017-10-18得票数 0

2回答

days=7days“中抓取数据

、、

我正在尝试从"“网站上抓取表格，因为python的输出正在抓取表格。import requests url = 'https://www.nseindia.com/companies-listing/corporate-filings-event-calendarborderSet maxHeight-900 scrollWrap').get_text().

浏览 3提问于2020-10-27得票数 0

1回答

如何使用美丽的汤和熊猫从这个网站上捕获结构化格式的表格？

、、、、

我想从这个网站上抓取表格，因为它每小时都在更新，所以我也想跟踪变化。我尝试过使用selenium抓取数据，但它们都在一个列中，没有任何表。如何使用pandas和Beautiful Soup以结构化的格式抓取表格并跟踪更改。这就是我想弄明白的代码。import pandas as pdsoup = BeautifulSoup(html, "html.parser&q

浏览 7提问于2020-09-23得票数 0

回答已采纳

1回答

使用find在python中抓取单个html表

、、、

我是python的新手，正在尝试从网页上抓取一个表格。我已经通过Chrome中的"inspect“访问了html。网页在这里： import bs4from bs4 import BeautifulSoup as soupuClient.read()page_soup = soup(page_html,

浏览 0提问于2017-11-16得票数 0

2回答

基于日期抓取表数据

、、、

我正在尝试抓取kurs事务的表from bs4 import BeautifulSoupheaders={ "User-Agent":"Mozilla/5.0

浏览 0提问于2020-11-24得票数 0

1回答

Python_Web_scraping Html表

、、

更具体地说，使用请求和bs4进行抓取。当尝试刮取以下链接时：“”import requests url ="http://directorybtr.az.govrequests.get(url) res.close() results = soup.find(&#

浏览 4提问于2017-11-23得票数 0

回答已采纳

1回答

在BeautifulSoup和Git Bash上进行网络抓取并传输到CSV

、、、

所以我一直在网上抓取一个有表格的网站，理想情况下，我想在网上抓取成excel表格，并将其保存在表格中，我将输入我所拥有的，我已经使用了scrapy和BeautifulSoup，我对这两个都有问题。import requestsfrom bs4 import BeautifulSoup url = 'https://pcpartpicker.com/products/video-card

浏览 1提问于2018-11-23得票数 0

2回答

如何在不对整数值进行舍入的情况下抓取网站表？

、、、

我正在从一个德国网站上抓取表格。德国人用逗号(，)表示小数(.)逗号为十进制。当我抓取表时，它会自动四舍五入或转换数据。例如，如果值是“2000”，则在德语中写为2.000。BS4将其转换为二(2) 有没有什么解决方案可以让我在不改变值的情况下抓取？这是我的代码。https://buchholz-stadtwerke.de/wasseranalyse.html" df = pd.read_html(requests.get(url).text, flavor=&

浏览 16提问于2020-09-28得票数 0

回答已采纳

1回答

丢失的桌子与美丽的汤网络刮擦

、

我一直在尝试从hockey.com网站上抓取团队数据，我只能读到from bs4 import BeautifulSoup as bsimportrequests.get(site)data = soup.find_all('table') 即使html代码表明其中有表，也不返回任何内容为什么美丽汤找不到表格

浏览 0提问于2020-12-12得票数 0

3回答

在使用美汤抓取表数据时遇到麻烦

、、、

我想从这个site中抓取表格数据。我尝试了下面的代码，但无论出于什么原因，BS4似乎无法获取表数据： import bs4 as bs sauce = urllib.request.urlopen

浏览 30提问于2020-10-24得票数 1

回答已采纳

点击加载更多