抓取HTML表python bs4

文章/答案/技术大牛

发布

1回答

、、、

我会从Transfermarkt player配置文件页面的两个html表中抓取数据。下面是一个页面示例：https://www.transfermarkt.com/cristiano-ronaldo/profil/spieler/8198 第一个是“事实和数据”表，第二个是“统计”表。我想开始从搜索页面抓取urls。一旦我从搜索页面的每一个页面获得urls，就开始抓取每个玩家链接的统计数据。如何从链接中<e

浏览 14提问于2021-04-13得票数 1

2回答

使用python抓取动态javascript内容网页

、、、、

我正在尝试使用Python抓取这个网站：'‘。但是，requests + BS4只给了我HTML格式的页面源代码。我假设这是因为内容是动态的。因此，我尝试了Selenium + BS4来抓取网站，但我仍然只能抓取页面源代码。from selenium.webdriver import Firefoximport

浏览 4提问于2020-02-02得票数 0

1回答

如何从此网页上的Google表中刮取数据？

、、、

我正在尝试使用Python从这个网页上的表中抓取数据。我尝试使用请求和bs4。我得到了原始的HTML，但是看起来数据是隐藏的。我该怎么做？

浏览 1提问于2016-12-19得票数 0

回答已采纳

1回答

如何从承载HTML之外的表数据的网站中刮表？

、、、、

我正在尝试从这个表URL：中抓取表数据在之前的测试中，我使用了以下Python包:从bs4导入BeautifulSoup导入请求导入mysql.connector作为pd从sqlalchemy导入create_engine我试着用我以前刮过的

浏览 3提问于2022-04-02得票数 -1

回答已采纳

1回答

额外的HTML导致bs4出现问题

、、

到目前为止，我能够从站点下载HTML并将其写入文件，但是当使用bs4解析和抓取我想要的特定表时，它只是抓取每个表的第一行。这是因为HTML表的每一行都有一个额外的标记：<td><a href="https://abraham.house.gov/"></td> <

浏览 4提问于2017-04-29得票数 0

回答已采纳

1回答

访问HTML注释中的标记

、、、

我已经通过BS4熟悉了使用Python进行web抓取的过程。我还没有找到嵌入在注释中的DOM标记的解决方案。例如，当试图从.html页面()获取数据时，检查页面上的表显示：我通常可以用BeautifulSoup抓取。但是，当我查看实际的页面源时，上述表被包含在注释标记中：我一直无

浏览 0提问于2018-12-11得票数 0

回答已采纳

2回答

Python web抓取返回错误

、、

我目前正在学习Python，并尝试学习web抓取。我一直在使用我从一些教程中获得的示例代码，但我在查看的一个网站上遇到了问题。DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-文档类型与我无法从文档中抓取有什么关系吗？

浏览 1提问于2013-10-18得票数 0

0回答

Python BeautifulSoup找不到表ID

、、

我在使用BeautifulSoup抓取表时遇到了一些问题。以下是我的代码from bs4 import BeautifulSoup None 当我右键单击表检查元素时，HTML<

浏览 4提问于2017-06-08得票数 1

回答已采纳

2回答

为什么来自Python* Pandas的Read_HTML不能工作？*

、、、

我想使用Python Pandas Read_HTML()函数从雅虎金融表中抓取信息，如截图所示，以红色边框显示。 ? pip install bs4!pip install pytest-astropy!pip install plotly from bs4 import BeautifulSoup import

浏览 54提问于2021-07-05得票数 1

回答已采纳

2回答

当web在Python中搜索表时，返回一个空表。

我需要通过使用Python中的BeautifulSoup库进行web抓取，从网站抓取一个表。来自URL https://www.nytimes.com/interactive/2021/world/covid-vaccinations-tracker.htmlimport requests# vaacineP

浏览 0提问于2021-04-18得票数 3

回答已采纳

2回答

使用Beautifulsoup抓取格式奇怪的数字

、、、

我正在尝试使用HTML抓取一个HTML表，但是对于像这样格式化的数字，BS4中的247 759 384 (read as 247759384)在Python中的显示是不同的。我想按表中的形式输出它们。

浏览 0提问于2019-11-09得票数 0

1回答

Python web抓取<a>之间的访问值</a>

、

假设我有这样的html代码：<a aria-current="page" aria-label="Current page" href="https://name_webpage.com/">1</a>如何使用python访问<a> </a>之间的值，即1？

浏览 2提问于2021-02-18得票数 0

3回答

如何使用Python* Pandas Lib设置For循环来读取URL列表并抓取数据*

、

这是我的第一个Python脚本。我目前正在尝试从多个url中抓取嵌入到HTML表中的数据，这些url位于一个名为url-list.txt的文件中。我已经成功地使用Python的Panda库从一个页面中抓取了所需的数据，然而，我正在尝试执行一个简单的for循环，从url-list.txt文件中加载每个url，以便从剩余的100个左右的url中抓取数据import bs4 as bsimport pandas

浏览 4提问于2019-06-08得票数 0

1回答

使用find在python中抓取单个html表

、、、

我是python的新手，正在尝试从网页上抓取一个表格。我已经通过Chrome中的"inspect“访问了html。网页在这里： import bs4from bs4 import BeautifulSoup as soup= uReq(my_url)uClient.close() #perform html

浏览 0提问于2017-11-16得票数 0

1回答

用Python/BS4* 4抓取表*

、、

我试图用和Python2.7从BS4中抓取"Team“表。www.pro-football-reference.com/boxscores/201602070den.htm'soup = BeautifulSoup(page.text, "html5lib

浏览 5提问于2016-07-25得票数 1

回答已采纳

2回答

基于日期抓取表数据

、、、

我正在尝试抓取kurs事务的表from bs4 import BeautifulSoupheaders={ "User-Agent":"Mozil

浏览 0提问于2020-11-24得票数 0

2回答

Visual Studio Python的美汤

、

我正在使用Python的Visual Studio。我想安装用于web抓取的Beatifulsoup。作为解释器安装的Python 3.4。from urllib.request import urlopenhtml = urlopen("http://www.pythonscra

浏览 21提问于2017-01-10得票数 0

2回答

无法使用Python从网站中抓取数据

、、

我想从“在交易所交易的债券”和“场外交易”中提取表格，并将其保存到excel工作表中。我正在尝试用python抓取数据( BS & requests )，但是我无法抓取数据(我不想使用selenium)。any1可以指导我吗？我没有收到任何错误，它没有在python终端中被处理我认为终端被挂起了，因为我甚至没有得到任何错误消息。import requestsimport os from bs4 import BeautifulSoup a

浏览 22提问于2021-09-09得票数 1

回答已采纳

2回答

BeautifulSoup -将HTML表转换为CSV并获取一列的href

、、、

我正在用下面的代码抓取一个HTML表：import urllib2 writer = csv.writer(f) url = "file:///C:/projects/HTMLfi

浏览 0提问于2015-01-15得票数 5

回答已采纳

1回答

Python_Web_scraping Html表

、、

我是Python初学者开发人员，我还在学习阶段。更具体地说，使用请求和bs4进行抓取。当尝试刮取以下链接时：“”import requests url ="http://directorybtr.az.govZip%20Like%20%22850%25%22" soup = BeautifulSoup(res.text, 'html<

浏览 4提问于2017-11-23得票数 0

回答已采纳

点击加载更多