使用selenium进行webscraping，单击一个按钮即可抓取所有内容_如何使用Selenium和BeautifulSoup抓取页面，然后单击按钮转到下一页进行抓取_使用单击“下一步”按钮进行Selenium web抓取会导致重复值 - 腾讯云开发者社区

python、selenium-webdriver、web-scraping

最初的刮板看起来像这样，我相信它做了我需要它做的所有事情： url = "https://matrix.heartlandmls.com/Matrix/Public/Portal.aspx?div/div/div[5]/div[2]/div/div[1]/div/div/span/ul/li[2]/a").click() i -= 1 这会将所有

浏览 12提问于2020-09-26得票数 0

回答已采纳

2回答

可以通过编程方式调用的Python屏幕捕获脚本？

python、screenshot

我想打开一个页面，抓取屏幕，并使用PIL获取其平均颜色。我想打开大约100个页面，所以我认为使用Python的屏幕截图脚本会很有用。我和我决定使用：A simple screen grabbing utility @date 2009-03-17 from PIL

浏览 0提问于2011-09-26得票数 1

回答已采纳

3回答

用于web抓取的Selenium与BeautifulSoup

javascript、python、selenium、beautifulsoup

我正在使用Python从一个网站上抓取内容。首先，我在Python上使用了BeautifulSoup和Mechanize，但我看到网站上有一个通过JavaScript创建内容的按钮，所以我决定使用Selenium。既然我可以通过像driver.find_element_by_xpath这样的方法使用Selenium查找元素并获取它们的内容，那么当我可以使用

浏览 1提问于2013-07-03得票数 53

回答已采纳

1回答

使用python爬行页面

python、selenium、web-crawler

我正在制作一个爬虫，可以用于所有的电子商务网站。目前，我正在以下网站上测试我的爬虫。在中，我需要单击显示更多结果，以便显示更多产品。在中，我只需向下滚动即可获得更多产品在中，按下next按钮可以获得更多产品。每个网站都有不同的按钮类/标签，那么我如何才能确定

浏览 1提问于2014-06-14得票数 0

1回答

基于动态内容和隐藏数据表的Selenium* Web抓取*

python、selenium、dynamic、web-scraping、beautifulsoup

我正在使用Selenium和Beautiful Soup在Python中对动态内容进行web抓取。问题是，即使使用以下代码，也无法将定价数据表解析为Python：sel_soup=BeautifulSoup(html, 'html.parser') 然而，我后来发现，如果我在使用上面的代码之前单

浏览 15提问于2018-02-14得票数 2

1回答

使用JavaScript更新的刮伤和内容

python、python-2.7、scrapy

我想刮(头条新闻，日期，时间)一个本地音乐场地网站：我使用scrapy调用url来爬行，但是对于scrapy，响应是不可读的(JavaScript？未渲染的多姆？有人能告诉我这是什么吗？我很好奇。)我见过人们

浏览 0提问于2015-01-08得票数 0

回答已采纳

1回答

在Selenium中选择下拉列表中的值时，按钮未启用

selenium

在我的应用程序中有一个“保存”按钮，在下拉列表中选择一个值即可启用该按钮。“语言”。在使用Selenium进行此操作时，即使在选择此值之后，该按钮也未启用，因此测试失败，因为Selenium无法单击禁用的按钮。我该如何处理这种情况

浏览 2提问于2018-10-29得票数 0

1回答

需要帮助减少抓取动态内容的执行时间

javascript、python、selenium-webdriver、web-scraping、beautifulsoup

我目前正在使用Selenium (铬)从一个网站上抓取动态内容，但是自动浏览器处理起来太慢了。(在我正在抓取的个人资料页面上有一个“查看更多”按钮，每次点击只加载5个帖子)没有其他方法可以访问这些“隐藏的”帖子，而不单击“查看更多”按钮，手动单击该按钮以检索不久前的帖子需要花费太长的时间。

浏览 7提问于2019-07-10得票数 0

回答已采纳

1回答

刮掉需要按一下按钮的网站

r、web-scraping、rvest

不幸的是，我想用rvest刮的数据隐藏在一个按钮(加号)后面。我试着用rvest包来做这件事，我使用了以下代码：url <- 'https://transparency.entsoe.eu/generation/r2/actualGenerationPerGenerationUnithtml_session(url) %>% html_nodes(".dv-value-cell&q

浏览 0提问于2017-03-23得票数 5

回答已采纳

1回答

Python Selenium* div隐藏在inspect中，无法在实际页面上看到显示div的按钮*

python、html

我正在使用Selenium (链接在这里https://www.hltv.org/stats/players)用Python语言编写一个web抓取脚本，我想要抓取每个播放器的所有链接。它显示了许多播放器，但不是所有的，我看不到在实际页面上显示这些元素的按钮，它们隐藏在页面后面。如果我检查页面，有一个表格显示了一些在页面上可以看到的内容，那么在类名称“隐藏”下还有更多。但是，如果

浏览 9提问于2020-12-06得票数 0

回答已采纳

2回答

Python -如何在URL中不分页地刮分页

python-3.x、web-scraping

如何使用URL访问下一页，内容如下：我知道如何使用刮取库(BS4、Selenium)，但我不知道如何抓取这样的站点。我一直在玩谷歌Chrome开发工具，但没有成功。像Python这样的抓取站点通常的工作流程是什么？

浏览 0提问于2019-07-05得票数 0

回答已采纳

2回答

我如何在python中使用BeautifulSoup来抓取一个网站的所有结果，所有结果都在一个页面上？

python、html、beautifulsoup、screen-scraping

我正在尝试从抓取所有的搜索结果。如果你去网站，你会看到在结果的底部有一个按钮来显示更多的结果，这将继续下去，直到没有更多的结果。我不确定如何从所有的结果中抓取数据，然后检查它是否完整。下面的代码适用于最初显示在结果页面上的内容。感谢你在这里的帮助！

浏览 0提问于2021-06-05得票数 0

1回答

使用工具并在最外层的HTML元素上单击“复制OuterHTML”意味着什么？

python、selenium、google-chrome、web-scraping

以前，我只是使用Google及其开发工具来复制/粘贴某个网站的HTML代码。我只是手动使用工具，右键单击最外层的HTML类，然后按下“复制OuterHTML”，然后将其粘贴到记事本文本文件中，然后开始工作。在我的手册谷歌开发工具抓取，我可以看到我想要的

浏览 3提问于2021-12-06得票数 0

1回答

使用Python PyQt对Javascript内容进行网页抓取

javascript、python、web-scraping、pyqt

我现在正在执行一项任务，系统地从似乎是由javascript呈现的课程列表中抓取内容。我在web上使用PyQt4遵循了一些脚本，但失败了(我在下面复制了它)。更准确地说，这个脚本在一些网站上使用javascript，它通过点击特定的链接来加载内容。然而，下面的网站(ouhk，我在下面的脚本中复制的链接)似乎没有指向特定内容的链接，即节目信息、节目结构和费用等。相反，它使用标签容器和FTP来存储和加载信息(我从其源代码中找到)。我想知道是否有任何方法可以修改以下脚本，以便

浏览 17提问于2016-09-21得票数 3

1回答

如何使用Selenium和多进程更快地进行with抓取？

python、selenium

使用下面的代码，我能够做网站列表的网络抓取。我想知道如何使用多处理来使包装更快。基本上，我想要的是让for j in list_j一次遍历list_j中的所有元素，而不是一个接一个。from selenium import webdriver list_j = ['17098794000170', '17144039000185', '10347985000180', '3278489800012

浏览 2提问于2020-12-05得票数 0

回答已采纳

1回答

如何将音乐上传到像spotify，itunes这样的网站

python、spotify、itunes

我想编写一个Python应用程序，它可以自动化音乐或播客到iTunes、Spotify和其他流平台的上传过程。它应该把音乐放到我的目录中，然后上传到这些平台上(最终让这些媒体赚钱)。

浏览 2提问于2020-08-29得票数 1

回答已采纳

2回答

基于日期抓取表数据

python、web-scraping、beautifulsoup、screen-scraping

我正在尝试抓取kurs事务的表从2015-2020年，但问题是默认日期和我选择的日期之间的链接仍然是相同的。那么我如何告诉python从2015-2020(20-11-15-20-11-20)抓取数据呢？我对python和python3的使用非常陌生。

浏览 0提问于2020-11-24得票数 0

2回答

Python Selenium* Web驱动程序在Url中传递整数变量*

python、selenium、selenium-webdriver

我使用Python \ Selenium \ Chrome驱动程序执行webscraping抓取。我想将一个INT变量(id)传递给URL --我如何做到这一点？我已经尝试了以下所有内容，但是在这一行中出现了Python错误： #urlg = 'https://mythirteen.co.uk

浏览 2提问于2022-04-14得票数 0

回答已采纳

1回答

在分页中刮取多个url保持不变的页面

python、web-scraping、scrapy

我想刮多个页面，但是当我移动到其他页面时，URL保持不变，我刮多个页面，如果有任何解决方案，请提供页面链接为from scrapy.http import Request name = 'test' custom_settings = { 'CONCURRENT_REQUES

浏览 13提问于2022-06-18得票数 2

1回答

适合浏览网站的Python模块

python、html、python-3.x、web-scraping、navigation

我正在寻找一个python模块，可以让我浏览搜索栏，链接等的网站。就上下文而言，我希望对这个网站做一些网络抓取，我只想获取有关2020年选举的每个州的信息(投票数据等)，并将其组织在一个数据库集合中。显然，有许多州需要通过，每个州都在一个单独的网页上。因此，我在python中寻找一种方法，在这个方法中，我可以快速地浏览站点，获取每个页面的数据等等，以及更新和添加现有的数据。

浏览 3提问于2020-05-24得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云