从单个url抓取具有多个页面的表格_从具有多个页面的网站抓取数据_抓取具有多个页面的站点，这些页面保留相同的url？ - 腾讯云开发者社区

python、selenium、url、web-scraping、beautifulsoup

我正在尝试从KKP网站上抓取数据。这些表存在一些页面，但所有页面都使用相同的url。我对网络抓取数据非常陌生。我目前正在使用selenium来抓取表格，但那只包含第一页，但我想抓取所有的页面。如果你使用BeautifulSoup来抓取数据，我没有问题。我希望有人能帮助我。

浏览 29提问于2021-07-26得票数 1

1回答

页面包含多个规范问题

seo

从表格上我得到了450个规范问题。所有错误的格式如下：具有URL "“的页面也可以通过使用URL "".Search引擎通过使用URL标识唯一页面来访问。当可以使用多个URL中的任何一个来访问单个页面时，搜索引擎假定存在多个唯一页面。使用单个URL来引用页面，以防止页面相关性被稀释。您可以通过遵循标准的UR

浏览 3提问于2010-07-30得票数 0

1回答

逐页从网页中提取表格

r、function、web、web-scraping、httr

我已经写了一个从网页上抓取表格的代码。下面的代码从第一页提取表格(在url /page=0中)：login <- "john.johnson" (fake) r

浏览 2提问于2020-07-02得票数 0

1回答

如何使用数据抓取(UIPATH)从特定的页面范围(第11页到第20页)获取数据？

uipath

在应用过滤器之后，我正在尝试使用UiPath中的数据抓取向导来获取从第11页到第20页的书籍的详细信息，并将它们输入到Excel文件中。我试着把数据抓取活动放在一个循环中，我试着用一个计数器来选择页面，但是都不起作用。有人能帮上忙吗？

浏览 1提问于2020-10-31得票数 0

2回答

熊猫网抓取多个网页

python、pandas、web-scraping、beautifulsoup

我正在为以下给定的网站在多个页面上使用“美丽汤”来抓取数据，并且能够做到。我可以使用Pandas抓取多个页面的数据吗？下面是抓取单个页面的代码，并且URL有链接到其他页面，如。import pandas as pddframe = pd.read

浏览 3提问于2017-11-09得票数 2

回答已采纳

1回答

从coinmarketcap中抓取历史数据

r、web-scraping、tidyverse、rvest

我一般不会从web上抓取表格，但由于某些原因，当我试图从下一页抓取历史数据时，我无法选择想要的表格。这是链接和我的代码 library(tidyverse) table <- <em

浏览 85提问于2020-11-10得票数 1

回答已采纳

1回答

使用php preg_match_all & cURL从多个页面抓取/下载图片

php、image、curl、preg-match-all

所以我试着从另一个网站获取一些图片，问题是每个图片都在不同的页面上到目前为止，我有下面的代码，它可以从给定的单个URL抓取图像，使用：但需要让上面的行变成一个数组(我猜)，这样它就会从第一<em

浏览 0提问于2011-10-13得票数 4

回答已采纳

1回答

如何正确删除Google索引中的参数？

google-search-console、url-parameters

在URL参数下的GWT控制台中，有两个设置我不清楚。将URL参数设置为：和我试图从索引中删除所有具有特定参数的URL，并且不确定要选择哪个设置。我已经提交了一个带有新URL的站点地图，我也会设置一个301重定向到新的URL，但是我认为我们的一些旧参数导致了爬行效率和重

浏览 0提问于2015-11-09得票数 6

1回答

使用R抓取具有多个页面的HTML表格

xml、r、web-scraping

我正在尝试通过从网络上抓取数据来制作一个数据框。但是有多个页面组成了我想要抓取的表格。链接相同，但页面不同。对于第一页，我是这样抓取它的：CB.13<- "http://www.nfl.com/stats/categorystats?PDef", "Int", "TDs", "Yds", "Lng", "F

浏览 0提问于2014-04-23得票数 4

1回答

从单列中抓取数据，而不是以表格式

python-3.x、selenium、selenium-webdriver、web-scraping

我用python编写了一个脚本，使用selenium从网页的表中解析出数据。但是，当我运行它时，我得到的是单个列中的抓取数据，而不是表格格式。我应该在我的脚本中进行什么类型的更改才能获得表格式的数据？//td"): 我所说的表格格式类似于下面的内容。但是，我在单个列中获取数据，而不是像下面这样在多个列中获取数据。

浏览 11提问于2017-06-24得票数 0

回答已采纳

1回答

我是一个网络抓取新手，需要帮助。我试图从一个有大约20页的属性站点中抓取数据，在每个页面中有到不同属性的18条链接。我的最终目标是从每个属性链接中抓取所有数据。为此，我考虑通过将页面参数增加1来运行20页的循环。但在这样做之前，我需要从单个页面上的每个属性中抓取数据，为此我需要链接到单个页面上的所有属性，因此需要从页面中抓取所有链接(指向属性)。下面是用于获取单个页面上所有链接的代码，但没有获得所

浏览 1提问于2018-09-26得票数 0

回答已采纳

1回答

iis上的SEO规范问题解决方案

seo、canonical-link

错误是：我该如何解决这个问题？

浏览 3提问于2010-06-07得票数 0

1回答

从r中的多个urls中进行from抓取

r、web-scraping

我正在尝试从多个urls中抓取表。我使用以下代码从单个url中抓取表：library(rvest) html_element('table.table_subtle

浏览 4提问于2022-08-05得票数 0

回答已采纳

1回答

使用R在多个页面上进行Web抓取

r、web-scraping

我正在尝试使用R中的以下url来抓取产品的评论。当我运行下面的代码时，我能够获得单个评论被抓取。html_node(".content-item-text") %>% html_text()但是，当我使用下面的代码抓取多个页面上的多个注释时review_page=2', 2

浏览 10提问于2017-06-27得票数 0

1回答

Google索引与wordpress不同的URL

wordpress、url、woocommerce、google-indexing-api

我的站点使用的url是：https://example.com/product/product-name/ 但是谷歌将这个网址索引为：https://example.com/product-name/

浏览 22提问于2019-04-17得票数 0

2回答

具有多页的javascript表上的Python BeautifulSoup

javascript、python、screen-scraping、beautifulsoup

然而，这个网站最近将表格的编码改为javascript，我在使用它时遇到了麻烦，因为表格有多个页面。例如，在上面的链接中，我如何从表的第1页和第2页获取数据？FWIW，URL不会改变。

浏览 3提问于2012-01-18得票数 1

回答已采纳

1回答

通过多个read_html链接创建数据循环

python、pandas、dataframe

我对python很陌生，我正在尝试从一个网站的多个页面中抓取一张表。import pandas as pdfrom bs4 import BeautifulSoup from tabula

浏览 0提问于2019-01-06得票数 0

回答已采纳

1回答

R从多个唯一的urls中抓取表

r、rvest

我希望从多个，唯一的网址，我已经在一个列的excel表中列出的表格。我已经准备好了从单个url抓取的正确代码： library(rvest)library(readxl) urls <- (data$URL) 不

浏览 16提问于2021-08-05得票数 0

回答已采纳

9回答

appengine上的爬虫

google-app-engine

我想在appengine.This上连续运行一个程序，程序会自动连续抓取一些网站，并将数据存储到它的database.Is中，程序有可能继续在appengine上这样做吗?注意:要抓取的网站不会存储在appengine上

浏览 0提问于2010-06-22得票数 5

1回答

如何用美汤抓取多页搜索结果

python、web-scraping、beautifulsoup

使用以下url：我已尝试更改开始日期和结束日期，但无济于事。当我用漂亮的汤刮的时候，我只能刮掉第一页的结果，然后刮就停止了。我在抓取(在本例中)全部85页的结果时遗漏了什么？(并且-我的代码是成功的，但只返回结果的第1页的抓取结果)。

浏览 8提问于2020-02-26得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云