使用BeautifulSoup 4.8.2从网站抓取表格

文章/答案/技术大牛

发布

1回答

、、

我正试着从一个网站上刮一张桌子，但它不是很有效。我使用的是Python3.7.4和bs4 4.8.2。另外，我不精通HTML，所以如果我把一些术语弄错了，请原谅。我试图用"id = 'track_1_box'“来抓取父类下的表类，这个表类可以看到是here。我试图提取的信息是字符串"title = 'Canada'“和"Cole”，但现在我甚至无法访问该表。import requestsfrom bs4 impor

浏览 13提问于2020-07-06得票数 1

回答已采纳

1回答

从Tableau公共仪表板中抓取数据

、、、

我对从网站上抓取数据的世界非常陌生，不知道如何从使用Tableau Public的网站上抓取数据网址：https://showmestrong.mo.gov/data/public-health/我试过在Python、requests和BeautifulSoup中使用，但不知道如何工作。import requests from bs4 import BeautifulSoup

浏览 17提问于2020-09-30得票数 1

回答已采纳

1回答

使用BS4从python中抓取团队统计表

、、、

我正在尝试从职业足球参考中抓取一个表格，特别是来自的团队进攻表。每当我尝试下面的代码时，我都会得到一个空列表或一个NoneType。我已经抓取了其他网站，如ESPN，没有任何问题。import requests response = reque

浏览 2提问于2020-08-13得票数 1

1回答

在BeautifulSoup和Git Bash上进行网络抓取并传输到CSV

、、、

所以我一直在网上抓取一个有表格的网站，理想情况下，我想在网上抓取成excel表格，并将其保存在表格中，我将输入我所拥有的，我已经使用了scrapy和BeautifulSoup，我对这两个都有问题。import requestsfrom bs4 import BeautifulSoup url = 'https://pcpartpicker.com/products&#x

浏览 1提问于2018-11-23得票数 0

2回答

如何从"https://www.nseindia.com/companies-listing/corporate-filings-event-calendar?days=7days“中抓取数据

、、

我正在尝试从"“网站上抓取表格，因为python的输出正在抓取表格。import requests url = 'https://www.nseindia.com/companies-listing/corporate-filings-event-calendar/79.0.3945.117 Safari/537.36'

浏览 3提问于2020-10-27得票数 0

2回答

当web在Python中搜索表时，返回一个空表。

我需要通过使用Python中的BeautifulSoup库进行web抓取，从网站抓取一个表。interactive/2021/world/covid-vaccinations-tracker.htmlimport requests from bs4 import BeautifulSoup//www.nytimes.com/interactive/2021&#

浏览 0提问于2021-04-18得票数 3

回答已采纳

2回答

如何使用python从网站的搜索栏中提取数据？

、

我想从一个包含许多医生和医院名称的网站中提取数据，我想做一些评估，所以我决定使用搜索栏，但不幸的是，似乎无法得到我想要的结果！import requests r

浏览 3提问于2018-06-11得票数 2

回答已采纳

1回答

如何在Python中对带有图片的表格进行and抓取并导出到Excel中？

、、

我正试着从URL上盗取一张桌子我可以使用Scrapestorm工具抓取表格数据。我是python的新手，不能从这个URL获取数据。from bs4 import BeautifulSoup soup = BeautifulSoup(pa

浏览 61提问于2020-12-23得票数 1

回答已采纳

2回答

从下拉列表中选择后进行抓取

、、

我试图从以下网站抓取数据：import requestsimport html5lib headers = {'User-Agenthttps://shafafiyah.socpa.org.sa/EmployeeDetails.aspx&quo

浏览 7提问于2022-10-30得票数 1

5回答

如何从其他网站获取数据？

、、、

我想创建一个网站，从其他网站提取信息，并将它们打印到我的网站上，我正在进行研究，所以我想听取一些意见，这个项目的最佳解决方案是什么？我听说Python使用解析器可以做到这一点，我只是想知道我应该走哪条路，应该使用哪种语言？

浏览 1提问于2013-06-14得票数 4

3回答

Python抓取--当页面通过JS加载内容时，如何用漂亮的汤获取资源？

、、、

因此，我试图使用BeautifulSoup和urllib从特定的网站中抓取一个表。我的目标是从这个表中的所有数据创建一个列表。我试过使用来自其他网站的表格来使用相同的代码，而且它工作得很好。但是，在尝试使用此网站时，该表返回一个NoneType对象。有人能帮我吗？我试过在网上寻找其他答案，但运气不太好。下面是代码：import urllib from bs4 im

浏览 5提问于2015-04-20得票数 6

回答已采纳

1回答

无法使用漂亮的汤刮除表中的所有行

、、

我试着从https://google.com/covid19-map/?hl=en网站上抓取表格行，以获得有关冠状病毒传播的数据。但是它只返回几行，在我的例子中是15行，我无法抓取所有行。表格在网站上不是完全可见的，需要滚动才能看到表格的内容。请帮帮忙。import requests URL = "https:

浏览 18提问于2020-03-30得票数 0

回答已采纳

2回答

使用python抓取AJAX电子商务站点

、、、、

我在使用BeautifulSoup抓取电子商务网站时遇到了问题。我做了一些谷歌搜索，但我仍然无法解决问题。请参阅图片： Result：这里是我试图刮的网站："“ 任何人都可以通过抓取AJAX站点来帮助我获得这些产品的数据。我想用在

浏览 0提问于2019-01-28得票数 2

回答已采纳

4回答

用Python实现表Web抓取问题

、、、

我有问题从这个网站抓取数据：我对python相对陌生，对web抓取完全陌生。以下是我到目前为止所拥有的：from bs4 import BeautifulSoup soup = Beauti

浏览 1提问于2020-06-22得票数 1

回答已采纳

1回答

如何使用美丽的汤和熊猫从这个网站上捕获结构化格式的表格？

、、、、

我想从这个网站上抓取表格，因为它每小时都在更新，所以我也想跟踪变化。我尝试过使用selenium抓取数据，但它们都在一个列中，没有任何表。如何使用pandas和Beautiful Soup以结构化的格式抓取表格并跟踪更改。这就是我想弄明白的代码。import pandas as pdsoup = BeautifulSoup(html, "html

浏览 7提问于2020-09-23得票数 0

回答已采纳

1回答

无法使用python web抓取获取此网站上的表

、

我需要得到这个网站上的表生活的基础上&无法下载csv，因为链接是隐藏在java脚本。Selenium也无法访问这个网站- 。

浏览 16提问于2020-08-04得票数 0

1回答

如何通过python向服务器提交表单并从服务器获取csv文件？

、、、、

我需要提交一个表格到服务器，并从服务器获得csv文件通过互联网与python。我想用python自动完成这些手工工作。我研究过python和web抓取，并使用过python模块(如BeautifulSoup)。然而，由于aspx的原因，这个网站很难做网页抓取

浏览 0提问于2014-07-23得票数 1

2回答

使用BeautifulSoup抓取网站

、

我在刮擦时得到属性错误from bs4 import BeautifulSoup page = urllib2.urlopen(quote_page) name_box = soup.find

浏览 2提问于2019-08-07得票数 0

1回答

使用BeautifulSoup和Python从格式不佳的表中抓取一列

、

我正在迭代合同的.csv，试图从网站中提取一个单独的列。我想从网页末尾的表格中抓取标签为“商品描述”的栏。但是，我不知道如何抓取列--只抓取行。下面是我目前正在使用的代码 url = "https://www.austintexas.gov/financeonlinecd=%s&dd=%d&i

浏览 12提问于2016-08-11得票数 2

回答已采纳

2回答

优美汤对象不包含来自网页的完整表，而是抓取前100行。

、、、

我试图从spotrac.com网站上抓取表格，并将数据保存到熊猫的数据中。无论出于什么原因，如果我正在抓取的表超过100行，则对象只会抓取表的前100行。只有前100行包含在BeautifulSoup对象和dataframe中。import pandas as pdfrom bs4 import BeautifulSoup # Begin requests sessionrunning-back

浏览 5提问于2020-07-01得票数 0

回答已采纳

点击加载更多