python抓取js_python js 动态抓取_python抓取js数据 - 腾讯云开发者社区

python、node.js

完成Node.js新手入门。最近，我接到一个任务，用python在web上抓取一个网站，然后使用Node.js中的python-shell包将python脚本连接到Node.js。我已经完成了抓取部分，但对Node.js没有任何先验知识。你能指导我如何解决这个问题吗？

浏览 0提问于2020-01-07得票数 0

1回答

是否更容易抓取AMP版本的网页？

web-scraping、beautifulsoup、web-crawler、amp-html、web-mining

我知道AMP协议要求Javascript的精简版本，我也知道Javascript (在一定程度上)使网站管理员能够检测/防止抓取。因此，从逻辑上讲，我认为抓取AMP网站会更容易一些。

浏览 11提问于2019-04-08得票数 0

2回答

我知道使用Python的Beautiful Soup抓取HTML的基础知识。但是，页面会进行AJAX调用，以获取球员上场时间的数据。(我使用firebug识别了网络调用)。我的问题是:有没有可能使用python来“抓取”这些信息？我需要什么工具，除了HTML我还应该知道什么？(我目前正在阅读有关JavaScript和AJAX的文章)。更新:几天后，我提出了一个在Python语言中结合使用Selenium和PhantomJS的解决方案。基本上，我使用Selenium转到每个链接，等待页面加载，然后抓

浏览 0提问于2013-11-02得票数 0

1回答

webcrawling-有哪些可能的方法来检测使用javascript加载的页面？

web-crawler

我想抓取一些网站。我正在使用selenium/PhantomJS抓取JS(react、angular、jquery等)。和python爬行其他所有的东西。我的主要问题是，我无法区分页面是否使用JS加载。任何想法都将受到欢迎！

浏览 2提问于2018-03-16得票数 0

1回答

如何从javascript文件运行我的纯python* (.py)文件*

javascript、python、selenium-chromedriver

我正在创建一个网站，从一个网站抓取数据，并在我的网站上显示该数据。我使用selenium进行抓取，这完全是用python编写的，它可以将抓取的数据转换为JSON。首先，如何通过虚拟主机在web浏览器中运行python文件。其次，我想要的是每天我的Javascript代码运行python文件，这样每当网站更新时，更新的数据也会显示在我的网站上。谁能指导我如何从Javascript运行Python文件。我也看过Brython，但它不能运行我的python

浏览 147提问于2021-01-03得票数 0

1回答

如何知道你是否被屏蔽从一个网站的网页刮刮？

python、web-scraping

catch (e){}</script> <script type="text/javascript" src="/fundadst.rvezxdcvwbzdewcsbar.js

浏览 6提问于2019-11-01得票数 0

回答已采纳

1回答

从Python调用JavaScript (第三方库)

javascript、python

另一种方法是使用selenium和无头铬或本地node.js服务，但这两种方法听起来都很重。

浏览 0提问于2019-10-22得票数 0

1回答

在python中浏览/解析html页面

python、html、parsing、browser、web-scraping

我正在使用Python3，到目前为止，我有Request用于简单的网页加载、自定义get和post消息，BeautifulSoup用于解析HTML树，我正在考虑尝试机械化来进行简单的网页交互。是否有某种集合的地方，所有的Python库挂起？因为我有时会发现很难找到我要找的东西。

浏览 3提问于2014-04-17得票数 1

回答已采纳

2回答

使用Python自动化创建例程的最佳方法

python、browser

它应该做的是浏览几个网站，点击一些按钮，抓取所需的信息，存储收集的信息，并填写一些表格。使用Python可以做到这一点吗？如果是，那么最紧凑的方法是什么？

浏览 1提问于2013-05-07得票数 0

1回答

如何在使用BeautifulSoup浏览网页时提取javascript中的内容

javascript、python、web-scraping、beautifulsoup

我在某处读到BS只解析HTML内容，而不解析JS部分。我该怎么做呢？要快速遍历，请查找我想要抓取的ModuleId 372309。谢谢！！ <script type="text/javascript" src="//www.walmart.com/c/midas/hl.js"></script"><

浏览 2提问于2014-04-13得票数 0

1回答

与Node.js上的Python* Request.session()类似的任何内容*

python、node.js、python-requests、axios、fetch

我有一个完全用python编写的web抓取应用程序。我在web上抓取的信息位于登录之后，我正在使用Request.session来保存登录会话。我正在尝试将代码移植到Node.js，但在Node.js上找不到任何类似于request.session的东西。如果存在这样的东西，请让我知道。谢谢。

浏览 38提问于2020-09-29得票数 0

回答已采纳

1回答

用Python进行web抓取并在React应用程序上显示数据

reactjs、web-scraping

我已经学会了如何使用python进行网络抓取并创建react应用程序，我想知道如果我想用python在web上刮擦数据，如果可能的话，会以什么样的方式在一个react应用程序上显示这些数据呢？

浏览 16提问于2022-07-13得票数 0

回答已采纳

1回答

从html页面不显示数据的url读取数据

beautifulsoup、python-3.5

我正在尝试以下代码：if __name__ == '__main__': import requests r = s.get(link) print(sou

浏览 1提问于2020-02-05得票数 0

1回答

无法抓取非html元素

python、html、web-scraping

我正在尝试从许多网站上抓取搜索结果。问题是，并不是所有这些网站都以纯html文本的形式返回搜索结果，其中很多都是用JS、AJAX等动态生成的。作为参考，我使用python。

浏览 0提问于2015-03-13得票数 0

2回答

在python中伪造cookie来抓取站点

python、cookies、cookiejar

我正在尝试抓取的站点使用js来创建cookie。我想的是，我可以用python创建一个cookie，然后使用这个cookie来抓取站点。然而，我不知道有什么方法可以做到这一点。有谁有什么想法吗？

浏览 2提问于2009-07-13得票数 2

回答已采纳

1回答

Python:用js抓取网页

python、selenium、web-scraping、beautifulsoup

我正在尝试使用selenium来刮LinkedIn。例如，这里有一个页面：<div id='results-col'> ... </div>browser = webdriver.PhantomJS(executable_path=PATH)bs_obj = BeautifulSoup(browser.page_source, "html.parser") results_col = bs_

浏览 3提问于2016-12-14得票数 0

回答已采纳

3回答

使用python快速抓取动态内容

python、selenium、web-scraping、beautifulsoup

我正在尝试使用Python动态内容，它是在JavaScript中生成的(这个视频的浏览量和评论数：)。我熟悉BeautifulSoup (运行大约0.1秒，但没有JavaScript评估)和Selenium (3+秒，即使我停用CSS、图像等，但解释JS)。有没有一种方法可以在不使用浏览器的情况下抓取Python语言中的JavaScript函数的结果(假设这就是降低Selenium速度的原因)？

浏览 0提问于2015-12-15得票数 3

2回答

如何在javascript中运行python脚本

javascript、python

中使用python 我想做一个活的网络刮刀。Python是最好的网络抓取工具。但我正试图在前端运行Python代码。所以我的应用程序的性能很好。

浏览 3提问于2022-05-08得票数 -1

2回答

获取用户密钥斗篷的最佳实践

python、vue.js、openid-connect、keycloak

我目前正在构建一个Vue.js前端应用程序，它与keycloak.js库一起工作。我还有一个用Python编写的后端。我是否需要先从后端抓取用户，然后在前端抓取用户？或者在前面直接把它们取回来。

浏览 1提问于2019-12-24得票数 1

回答已采纳

1回答

在中，如何处理“陈旧元素引用:元素没有附加到页面文档”中的致命错误？

php、selenium-webdriver、facebook-php-webdriver

我需要阅读从低温货币市场的要价/出价。但是，当市场过于拥挤时，就会出现“陈腐元素错误”。这是我第一次尝试选择数据：这是最后一个： $driver->wait()->until(WebD

浏览 5提问于2019-07-14得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

将Python脚本连接到Nodejs

是否更容易抓取AMP版本的网页？

使用Python通过AJAX抓取网页

webcrawling-有哪些可能的方法来检测使用javascript加载的页面？

如何从javascript文件运行我的纯python* (.py)文件*

如何知道你是否被屏蔽从一个网站的网页刮刮？

从Python调用JavaScript (第三方库)

在python中浏览/解析html页面

使用Python自动化创建例程的最佳方法

如何在使用BeautifulSoup浏览网页时提取javascript中的内容

与Node.js上的Python* Request.session()类似的任何内容*

用Python进行web抓取并在React应用程序上显示数据

从html页面不显示数据的url读取数据

无法抓取非html元素

在python中伪造cookie来抓取站点

Python:用js抓取网页

使用python快速抓取动态内容

如何在javascript中运行python脚本

获取用户密钥斗篷的最佳实践

在中，如何处理“陈旧元素引用:元素没有附加到页面文档”中的致命错误？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐