有没有一种在python中不使用selenium就能抓取JavaScript页面的方法？

在Python中，可以使用以下方法来抓取JavaScript页面而不使用Selenium：

使用Requests-HTML库：Requests-HTML是一个基于Requests库的HTML解析库，它可以解析JavaScript生成的页面。你可以使用它发送HTTP请求并解析响应内容。它使用了类似于jQuery的语法来选择和操作页面元素。你可以通过以下链接了解更多关于Requests-HTML库的信息：Requests-HTML库介绍
使用Pyppeteer库：Pyppeteer是一个无头浏览器的Python库，它提供了对Chrome浏览器的控制。你可以使用Pyppeteer来模拟浏览器行为，包括执行JavaScript代码和抓取动态生成的内容。你可以通过以下链接了解更多关于Pyppeteer库的信息：Pyppeteer库介绍
使用PyQt或PySide库：PyQt和PySide是Python的GUI库，它们提供了对WebKit浏览器引擎的封装。你可以使用它们来加载和渲染JavaScript页面，并抓取动态生成的内容。这种方法需要安装额外的库，并且需要一些额外的配置。你可以通过以下链接了解更多关于PyQt和PySide库的信息：PyQt官方网站，PySide官方网站

需要注意的是，这些方法可能不如Selenium灵活和强大，因为它们无法完全模拟浏览器的行为。但是，对于一些简单的JavaScript页面抓取任务，它们是有效的替代方案。

有没有一种在python中不使用selenium就能抓取JavaScript页面的方法？

、、

有没有一种方法可以在不含selenium的情况下，用python或lxml来抓取JS渲染的网页呢？谢谢

浏览 30提问于2020-09-29得票数 3

2回答

是否可以使用Selenium WebDriver来驱动PhantomJS？

、、、

我正在浏览Selenium WebDriver的文档，例如，它可以驱动Chrome。我在想，“驾驶”PhantomJS不是更有效率吗？ 有没有一种方法可以在PhantomJS中使用Selenium？我的预期用途是web抓取:我抓取的网站加载了AJAX和许多可爱的JavaScript，我认为这个设置可以很好地替代我目前正在使用的Scrapy Python框架。

浏览 4提问于2012-06-27得票数 35

回答已采纳

2回答

BeautifulSoup web抓取，无结果

、、

我在试着从https://hk.appledaily.com/search/apple..。我需要从div class="flex-feature"但它只返回[]..。希望大家能帮忙，谢谢！

浏览 40提问于2020-10-06得票数 2

回答已采纳

1回答

如何在silenium中获取下一页？

、、

我正在python中处理selenium，我想要抓取所有页面，但我遇到了麻烦:以下是我想要单击的元素： ? 我正在使用下面的代码： link=driver.find_element_by_link_text ('2') link.click() 但它会点击另一个元素 Deos有没有其他方法来获取下一页？

浏览 22提问于2021-03-25得票数 0

1回答

Web抓取:像Chrome一样更新数据？

、、、、

我在Python中遇到的所有关于web抓取的文章都引用了BeautifulSoup和Selenium作为从网页中检索HTML和JavaScript内容的主要工具。然而，我还没有找到一种方法来自动更新从同一网页接收的数据，而不需要向它发送新的请求。在Python中是不是不可能做你在Google Chrome中会做的事情，也就是说，简单地打开一个网页

浏览 9提问于2020-02-17得票数 0

回答已采纳

2回答

使用lxml.html抓取embed元素，或者如何欺骗网站使其认为你已经安装了Flash

、、、

我正在尝试抓取一个网站，我需要获取一个embed元素，但由于我使用的是Python和lxml.html，网站会准确地得出我没有安装Flash的结论，而不是显示embed元素，而是显示以下内容： <div

浏览 0提问于2012-07-04得票数 0

回答已采纳

1回答

使用Selenium和Scrapy通过onclick抓取显示的数据

、、

我使用Scrapy用python编写了一个脚本，以便使用身份验证从网站上抓取数据。我正在抓取的页面真的很痛苦，因为主要是由javascript和AJAX请求组成的。页面的所有主体都放在允许使用submit按钮更改页面的<form>中。URL不会改变(而且是一个.aspx)。我已经成功地从第一页抓取了所需的所有数据，然后使用以下代码更改了单击此输入按钮的

浏览 38提问于2019-02-21得票数 0

2回答

如何在python中实现动态网站(不使用selenium)

、、、、

Selenium有没有什么库或替代方法可以从动态(javascript渲染的)网站上抓取数据？我遇到的问题是，当我在selenium中使用webdriver时，许多网站可以很容易地检测到。我已经做了一些事情，比如在我的webdrver中更改了我的cdc_变量，但我仍然被检测到了。我一直在研究使用硒不被检测到的方法，但似乎不可能做到。因此，我正在寻找一种不

浏览 2提问于2020-05-24得票数 0

1回答

如何使用scrapy抓取具有onclick属性的复选框页面？

、、、、

我正在使用Scrapy从一个网页抓取一些数据。该页面有一个表单，其中包含多个复选框和下拉菜单，需要为表单选择所有这些复选框才能生成数据表。所有复选框都具有调用javascript代码的onClick属性，并且它们处于分层结构中，即有5个主复选框，每个复选框包含7个子类别的复选框，依此类推。复选框具有4个级别的树形结构。这是最低级别(叶)复选框之一： <input type="checkbox" name="mid" value="1043" id="

浏览 0提问于2013-06-04得票数 0

2回答

在没有Selenium* Webdriver的情况下抓取焦点*

、

我正在使用Selenium自动化一个网站。首先，我用C#打开主网站。然后，我手动单击以从主站点打开新窗口。现在，我想要抓取这些新窗口的数据。这不是问题。问题在于，Selenium似乎需要一个窗口来聚焦来刮掉它。在抓取之前，我目前使用SwitchTo方法。当您切换时，新窗口会弹出到前面，并从其他窗口窃取焦点。有没有一种方法可以在不聚焦的情况下抓取窗

浏览 0提问于2017-12-04得票数 1

1回答

无法在Google工作表中使用IMPORTHTML或IMPORTXML从网站中刮取数据

、、、、

我想刮从网站上的数据，如上面的截图(数据在红框)使用谷歌工作表。我尝试使用IMPORTHTML和IMPORTXML，但两者都无法工作(输出为空)。这是我的谷歌单子：我不确定是否可以使用IMPORTHTML或IMPORTXML从这个网站(IMPORTHTML)中刮取数据。或者可以使用Google脚本来实现这一点？

浏览 7提问于2021-08-20得票数 1

回答已采纳

2回答

Python -如何在URL中不分页地刮分页

、

如何使用URL访问下一页，内容如下：我知道如何使用刮取库(BS4、Selenium)，但我不知道如何抓取这样的站点。我一直在玩谷歌Chrome开发工具，但没有成功。我知道pubmed有API，但是API不返回我需要的信息(天气文章是否可以免费下载)。像Python这样的抓取站点通常的工作流程是什么？

浏览 0提问于2019-07-05得票数 0

回答已采纳

1回答

将Selenium* Python绑定用于javascript链接*

、、

我正在尝试使用Scrapy来解析一组相对简单的网页。主页有一堆链接，如下所示： <a name='LINK1$17' id='LINK1$17' tabindex='145' href="javascript:hAction_win0(document.win0International Relations', false, true);" class='SSSAZLINK'>International Relations<&#x

浏览 2提问于2013-04-22得票数 1

1回答

使用selenium检查javascript异常？

、、

我使用的是来自python的Selenium，使用的是Chrome后端的web驱动程序。我想在每次测试结束时检查一下，在测试过程中没有抛出javascript异常--基本上相当于打开JS控制台并查找红色文本。有没有一种简单的方法可以从selenium中做到这一点？我不希望从任何特定的javascript调用中捕获异常，我寻找的是

浏览 1提问于2012-02-28得票数 1

回答已采纳

3回答

用于web抓取的Selenium与BeautifulSoup

、、、

我正在使用Python从一个网站上抓取内容。首先，我在Python上使用了BeautifulSoup和Mechanize，但我看到网站上有一个通过JavaScript创建内容的按钮，所以我决定使用Selenium。既然我可以通过像driver.find_element_by_xpath这样的方法使用Selenium查找元素并获取它们的内容，那么当我可以使用

浏览 1提问于2013-07-03得票数 53

回答已采纳

1回答

被一行代码阻塞的bash标准输出

、、

我有一个bash脚本，其中我调用python脚本：python myscript.pyfrom selenium import webdriver我的

浏览 1提问于2019-02-26得票数 2

回答已采纳

2回答

如何使用selenium* web驱动程序托管由web抓取支持的后端服务？*

、、、、

因此，我正在开发一个项目来抓取一个网站并将数据传递给用户，但是我正在使用带有python/flask的selenium/selenium web驱动程序。我本来打算用漂亮的汤，但我抓取的网站需要在页面上进行一些交互。我有一切工作与刮刀，我只是试图找出一种方法，使这项工作，如果我想要托管在一个网站上使用的服务，如heroku。目前Selenium正在打开一个chrome浏览器，并

浏览 20提问于2020-05-03得票数 1

3回答

使用python快速抓取动态内容

、、、

我正在尝试使用Python动态内容，它是在JavaScript中生成的(这个视频的浏览量和评论数：)。我熟悉BeautifulSoup (运行大约0.1秒，但没有JavaScript评估)和Selenium (3+秒，即使我停用CSS、图像等，但解释JS)。有没有一种方法可以在不使用浏览器的情况下抓取Python语言中的JavaScript函数的

浏览 0提问于2015-12-15得票数 3

2回答

urllib.request + BeautifulSoup不能刮某些页面，而只能刮根页

、、、、

我在从url 中抓取信息时遇到了问题，但是由于网站处理事情的方式，BeautifulSoup只是从根页面收集数据，也就是。<main class="site-content" id="content"> <div class="loading-spinner" data-request="epsilon-" id=&qu

浏览 0提问于2017-01-26得票数 0

回答已采纳

2回答

使用Python抓取javascript生成的数据

、、、

我想用Python抓取下面的url的一些数据。我想刮掉的东西没有显示在第一页上。通过单击名为"재무제표“的页签，可以访问财务报表。点击名为“현금흐름표”的页签，进入“现金流”。然而，现金流数据是由javascript通过url生成的。正如您所看到的，第一个链接中的itemcode=078340表示股票代码，我希望收集现金流数据的股票多达1680只。我

浏览 2提问于2012-04-07得票数 8

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

有没有一种在python中不使用selenium就能抓取JavaScript页面的方法？

相关·内容

有没有一种在python中不使用selenium就能抓取JavaScript页面的方法？

是否可以使用Selenium WebDriver来驱动PhantomJS？

BeautifulSoup web抓取，无结果

如何在silenium中获取下一页？

Web抓取:像Chrome一样更新数据？

使用lxml.html抓取embed元素，或者如何欺骗网站使其认为你已经安装了Flash

使用Selenium和Scrapy通过onclick抓取显示的数据

如何在python中实现动态网站(不使用selenium)

如何使用scrapy抓取具有onclick属性的复选框页面？

在没有Selenium* Webdriver的情况下抓取焦点*

无法在Google工作表中使用IMPORTHTML或IMPORTXML从网站中刮取数据

Python -如何在URL中不分页地刮分页

将Selenium* Python绑定用于javascript链接*

使用selenium检查javascript异常？

用于web抓取的Selenium与BeautifulSoup

被一行代码阻塞的bash标准输出

如何使用selenium* web驱动程序托管由web抓取支持的后端服务？*

使用python快速抓取动态内容

urllib.request + BeautifulSoup不能刮某些页面，而只能刮根页

使用Python抓取javascript生成的数据

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐