如何使用Selenium抓取每行的网站id_使用selenium抓取价格的网站_如何使用selenium从网站抓取数据 - 腾讯云开发者社区

、、

我正在编写一个Python抓取代码来抓取网站id。它在网页上有29行，每行都有一个唯一的id。以下是我的代码 op = webdriver.ChromeOptions()driver.get(web) driver.fin

浏览 17提问于2021-08-05得票数 1

回答已采纳

2回答

使用登录页面从网站中抓取数据

、、、、

我正在尝试使用python登录我的大学网站，并使用以下代码登录requests库，但是我不能。import requests "Password": <passwrord>, "option": "credential

浏览 8提问于2018-01-17得票数 0

1回答

Python web抓取span id使用Beautiful soup

、

我试图从span id中提取一个数字数据，但我得到的输出是"--“。该代码不会显示错误消息，但不会打印"58990“这样的数字，而是会打印"--”。这个网站基本上每24小时更新一个数字，我希望每次更新这个数字时，我的代码都会被擦除。page-template page-template-template_vaccintracker page-template-template_vaccintracker-php page page-id-3717"

浏览 64提问于2021-02-12得票数 1

回答已采纳

1回答

我如何阻止所有的硒机器人？

、、、、

我如何阻止所有的硒机器人？我想阻止所有的selenium项目。我有非常大的网站，流媒体，动画等。每月至少3000万客和会员。在我们做检查和阻止，用户代理，速率限制，会话id检查许多机器人被阻止，但现在有人仍然抓取，改变代理IP，会话id再次发送的抓取请求。所以他/她绕过了我们的利

浏览 3提问于2021-01-09得票数 2

1回答

屏幕抓取-仍不工作

、

我想刮的html页面，有一些脚本运行，通常执行的脚本，以显示点击后的链接。一些人提到了firebug，另一些人则谈到了我需要的代码的逆向工程。但在尝试反向工程之后，我仍然不知道如何在跟踪脚本函数后获得数据。jQuery('.category-item a').click( idToShow = jQuery(this).attr('ida').removeClass

浏览 3提问于2010-03-13得票数 1

1回答

您如何区分哪些站点是HTML & JS，哪些站点是使用React、Angular等通过JS呈现的？

、、、

在创建我的第一个爬虫时，我想检查网站是否使用了某个框架。我知道我可以使用SplashRequest来使用无头浏览器来呈现它，但这样做效率不高。我如何才能弄清楚哪些网站需要通过Splash，哪些网站不需要这样做，而不是真正制作无用的SplashRequests？谢谢!

浏览 3提问于2021-03-26得票数 0

1回答

如何在python语言中使用selenium和chromedriver抓取此页面？

我正在尝试使用selenium和chromedriver从网站“”中抓取数据。当我运行代码时，chromedriver成功地输入了url，但无法加载页面，显示了一个空白页面。我尝试将目标网站切换到google.com，但抓取成功。我的结论是目标网站服务器检测到selenium并拒绝发送回数据。那么如何在Python语言中使用selenium和chromedriver从网站<

浏览 0提问于2020-05-29得票数 0

1回答

通过Python/Requests登录《华尔街日报》

、、、、

我从事一个学术项目，该项目需要使用由Requests和BeautifulSoup库提供支持的Python脚本来抓取互联网上的各种新闻文章。最近，我的任务是从“华尔街日报”上抓取文章，并给了我一个订阅登录来使用。然而，在过去的任务中，我从来不需要在浏览实际文章之前登录网站。我遵循了通过请求和POST登录的基本逻辑，但看起来WSJ的登录并不遵循该协议-我仍然收到“未订阅”的文章页面。此

浏览 17提问于2019-10-18得票数 0

回答已采纳

1回答

如何从使用AJAX和JavaScript的网站中刮取数据？

如果网站使用AJAX和JavaScript加载内容，则可能很难从站点中抓取数据。数据可以动态生成并存储在JavaScript变量中，使web刮刀无法访问数据。

浏览 7提问于2022-05-11得票数 0

1回答

使用Python PyQt对Javascript内容进行网页抓取

、、、

我现在正在执行一项任务，系统地从似乎是由javascript呈现的课程列表中抓取内容。我在web上使用PyQt4遵循了一些脚本，但失败了(我在下面复制了它)。更准确地说，这个脚本在一些网站上使用javascript，它通过点击特定的链接来加载内容。然而，下面的网站(ouhk，我在下面的脚本中复制的链接)似乎没有指向特定内容的链接，即节目信息、节目结构和费用等。相反，它使用标签容器和FTP来存储和加载信息(我从其源代码

浏览 17提问于2016-09-21得票数 3

2回答

如何优化抓取动态加载的站点？

、、、、

我正在尝试使用Python在上收集所有的鞋子。由于该站点是动态加载的，因此我使用selenium web驱动程序。这样做的问题是加载和运行页面需要很长时间。from bs4 import BeautifulSoupfrom selenium.webdriver.common.keys import

浏览 0提问于2021-01-12得票数 1

1回答

如何使用selenium* python自动分页？(无需手动选择next按钮)*

、、、、

我正在抓取图像的网站列表，使用selenium webdriver+scrapy，但每个网站的下一步按钮都有不同的类/div名称，如何自动查找不同网站中的下一页进行抓取？

浏览 11提问于2020-06-20得票数 0

2回答

如何打开常规铬，我们使用selenium进行手动浏览。

、、、

我是自动从网站的数据抓取。现在的网站只需要第一次登录。之后，如果你打开网站，它已经登录了。但是，当我使用selenium访问网站时，每次我通过selenium访问它时，它都会请求登录。我如何使用常规的chrome浏览器，其中它已经登录，使用selenium？或者还有别的选择吗？

浏览 10提问于2021-12-09得票数 1

1回答

使用python请求下载Mp4

、、

所以，我一直在做一个网络抓取脚本，从一个特定的网站下载一个视频，我做了，抓取网站，并有视频来源。这个视频有一个play botton，我试过在它上面使用selenium，但是我不知道如何使用selenium执行下载。id=96576')另外，我观察到播放视频的直接链接(上面的链接)有一个点击按钮，当

浏览 7提问于2020-03-18得票数 1

3回答

在python中创建到订阅站点的连接

、

我希望打开一个与的python连接，它通过POST方法获取我的登录参数。我想打开一个到这个网站的连接，以便抓取所有视频链接的网站(这，我也不知道怎么做，但我正在使用该项目学习)。我的问题是，我如何将我的证书传递到网站的各个页面？例如，如果我想要做的就是使用python代码打开一个指向的浏览器窗口，并让它在我已经

浏览 13提问于2017-02-01得票数 11

回答已采纳

1回答

是否使用Python通过Microsoft Live登录？

、、

我正在试着写一个程序，可以为战争机器4获取你的信息。我知道如何解析网页之类的，但我从来没有花时间通过python登录一个网站。现在，这带来了一个问题，因为我需要登录到我的Microsoft Live个人资料来获取我的统计数据。我试过我认为可行的方法，但每次都走进死胡同。这就是我目前所拥有的(这是有效的)import urllib2 username = 'USERNAME@hotmail.com'

浏览 10提问于2017-03-13得票数 1

2回答

使用BeautifulSoup从网页中抓取数据将返回None

、

我是个新手..例如，我正在尝试抓取像这样的东西(编号24) 但我的代码是

浏览 0提问于2016-11-28得票数 0

2回答

为什么在网络抓取蒸汽游戏列表时div返回为空？

、、、、

我刚开始使用BeautifulSoup4，所以如果我的问题很明显，我很抱歉。我正在尝试从Steam中获取播放小时数，但是<div id="games_list_rows" style="position: relative">返回None，而它应该返回很多不同的<div class="gameListRow" id="game_730">，里面有一些东西。我试过一个有几个游戏的朋友<e

浏览 31提问于2020-12-16得票数 0

回答已采纳

1回答

为什么我的网络抓取没有返回任何东西？

、

我对python上的web抓取是个新手。我有问题，当我运行我的代码，返回是白色空白，但它不是错误。我只是做了与课程相同的代码，但它对我不起作用 import urllib.request def __也许是从我的url打印所有内容，并使它变得很长，所以不能从我的代码或桌面返回它。有谁可以帮我？

浏览 22提问于2020-08-21得票数 0

1回答

在python gae上运行selenium？

、、

我有一个flask应用程序，它的端点使用selenium和铬驱动程序。我使用此代码来抓取angular网站的网页，创建一个json并将其提供给客户端。早些时候，这个站点很容易被BeautifulSoup抓取，我用来将json和put operation.This的当前时间一起存储在数据存储中，这样我就不会在每次客户端请求时都抓取网站，并且有一个函数可以确保在再次抓取网站之前5个小时

浏览 0提问于2018-12-26得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云