如何在不使用selenium的情况下使用Beautifulsoup或Python处理预加载器？

python、selenium、web-scraping、beautifulsoup

很少有网站会加载网站中的所有产品，也有很少的网站不会。="o-preloader hidden">Preloader</div>** 网址：https://www.ponds.com/us/en/products.html “显示更多”按钮可了解更多产品的总数为

浏览 20提问于2021-04-07得票数 0

4回答

JavaScript和HTML的抓取

javascript、python、parsing、web-scraping、web-crawler

我正在做一个项目，其中我需要抓取几个网站，并从他们收集不同种类的信息。信息，如文字，链接，图像等。有什么办法吗？

浏览 8提问于2014-03-31得票数 5

回答已采纳

1回答

如何动态抓取页面数据？

php、web-scraping、xmlhttprequest

我已经尝试了几天从一个网站获取一些数据，该网站使用asmx post请求来检索我想要的数据。我已经尝试过php curl，python，现在还有html解析器，但仍然没有成功。:["38"],"eventIds":[],"dateFilter":"All","marketsId":-1,"skinId":"betrebels"} 经过多次尝试，我发现这个链接提供了我想要获取的<

浏览 11提问于2017-07-18得票数 1

5回答

如何在Javascript中预载声音？

javascript、audio、preload

多亏了onload函数，我可以很容易地预加载图像。但它不适用于音频。浏览器，如Chrome，Safari，Firefox等不支持音频标签中的onload函数。如何在不使用JS库、不使用或创建HTML标签的情况下在Javascript中预加载声音？

浏览 119提问于2011-03-15得票数 54

回答已采纳

1回答

Python -单击链接时抓取数据不会更改URL

python、python-2.7、web-scraping

我想从这里抓取数据：在该页面中有一个标题为“市场流动”的部分，下面有3列：“最活跃的人”，"%获得者“，"%失败者”，每一个都可以点击。该部分列出了10只股票。同样在第10只股票的末尾，有一个可点击的矩形“再加载10个”。我想要做的是点击"%获得者“，同时点击”加载10多个“，查看排名前20的获得者列表，并在Python中抓取数据。

浏览 1提问于2015-09-11得票数 1

3回答

如何加载站点的所有资源，包括AJAX请求等。在Python中？

python、selenium、beautifulsoup、urllib2、python-requests

我知道如何申请一个网站并用Python阅读它的文本。在过去，我曾尝试使用像BeautifulSoup这样的库来发出对站点上的链接的所有请求，但这不会得到看起来不像完整urls的内容，例如AJAX请求和对原始域的大多数请求(因为"“将丢失，更重要的是，它不是<a href='url'>Link</a>格式的，所以Beautiful

浏览 2提问于2014-08-11得票数 3

2回答

在span标记中找不到元素

python-3.x、beautifulsoup

我正在尝试从这个网站上抓取数据:例如https://www.dailyfx.com/sentiment，我想知道有多少客户做多欧元/美元，但我无法获得span标记内的文本。https://www.dailyfx.com/sentiment' res.raise_for_status() span = soup.find(&quo

浏览 74提问于2019-04-21得票数 1

回答已采纳

1回答

Python刮板没有在某些子域上返回完整的html代码

python、web-scraping

我正在拼凑一个沃尔玛的评论刮刀，它目前从大多数沃尔玛的网页上刮起了html，没有问题。当我尝试抓取一页评论时，它只返回页面代码的一小部分，主要是来自评论的文本和一些错误标记。有人知道问题出在哪里吗？

浏览 11提问于2022-05-28得票数 2

2回答

尝试将数据从网站加载到json文件中。

python、json、python-requests

我试图将数据从一个网站加载到一个json文件中。m=1" print(r.text)print(r.json)继续：：import json，然后在我的应用程序中具体显示它们

浏览 2提问于2020-05-10得票数 0

2回答

使用BeautifulSoup调用JAVA函数

python、python-2.7、beautifulsoup

我正在尝试从下面的网站中搜集一些数据特别是，我想要抓取花名册表格中的数据在名为" csv“的表的标题处有一个红色链接，如果您单击它，页面将以csv格式加载表信息。_trackEvent('Tool','Action','Embed'); } catch (err) {}&quo

浏览 0提问于2013-11-24得票数 0

2回答

在Python代码中获取的HTML与显示的网页不同

python、html、web-scraping、scrapy

通过检查页面的XPath元素，我将其表复制到我的代码中，但在运行代码时只得到一个空列表。我尝试使用以下代码检查HTML中存在哪些表： from scrapy import Selectorimport pandas as pd table = sel.xpath('//table') 它只返回一个表，而且它不是我想要的那个

浏览 122提问于2020-09-06得票数 0

回答已采纳

1回答

Python戴尔驱动程序下载

python、beautifulsoup、href、urllib2

我一直在尽力为使用Beautifulsoup4的驱动程序获取所有的dl。但是，它会返回我不需要的链接。我想它们不知何故被藏起来了，我无论如何都不能把它们弄出来。是我想要销毁的页面：import urllib2 soup = Beaut

浏览 11提问于2018-01-13得票数 1

回答已采纳

2回答

如何在Python中抓取动态加载的JavaScript页面？

python

底线前面:我想刮这个网站的工作：，但我一直得到的javascript基页。如果您检查页面，您可以看到作业列在h3标记中，但不管我做什么，作业都不会弹出。我尝试了以下漂亮的汤代码： html_text = requests.get(url).text soup = BeautifulSoup(html_text, "

浏览 5提问于2021-10-17得票数 1

1回答

为什么python和我的web浏览器对同一个链接显示不同的代码？

python、html

在搜索给出的第一个链接上使用Chrome开发人员工具，我们可以看到以下html代码：现在，如果我运行以下代码：frombs4 import BeautifulSoup soup = BeautifulSoup(url)我找不到相同<

浏览 16提问于2016-07-26得票数 2

回答已采纳

1回答

抓取返回生成html节点的javascript文件的ajax页面

python、web-scraping

有些页面不返回ajax上的原始数据(如json、xml或html)。相反，他们使用一些框架，比如dojo，其中ajax调用返回js文件，而js文件以某种方式填充html节点。我想知道是否有一种非Selenium策略可以从这些页面中抓取数据。

浏览 2提问于2014-12-12得票数 1

回答已采纳

4回答

如何从网站中抓取动态内容？

python、dynamic、scrapy

因此，我使用刮除从亚马逊图书部分的数据。但不知怎么的，我知道它有一些动态数据。我想知道如何从网站中提取动态数据。response.urljoin(next_page)现在，我使用SelectorGadget选择一个类，我必须刮，但在动态网站的情况下，它不工作。那么，我如何刮一个有动态内容的网站呢？动态内容和静态内容之间到底有什

浏览 2提问于2019-04-16得票数 4

1回答

我试图刮多个网站(使用python2.7)，以确定是否存在特定的关键字在他们之内。经过手动检查(通过Chrome在URL源代码上搜索关键字，并通过Chrome检查元素)，我发现某些网站的源代码中确实包含@media和/或googleadservices.com/pagead/conversion_async.js，而我的爬虫说这些网站不包含这些关键字。也许这与这样一个事实有关:使用Chrome的“检查元素

浏览 4提问于2017-02-27得票数 1

回答已采纳

2回答

无法使用BeautifulSoup获取文章的urls

python、web-scraping、beautifulsoup、request、web-crawler

我使用BeautifulSoup从这个页面获取文章的urls：['https://www.usnews.com/news/health-news我使用了以下代码： soup_page = bs(response.text, 'lxml')url = i.find('a')

浏览 18提问于2020-05-28得票数 1

2回答

BeautifulSoup不会从网页中提取所有表单

python、html、forms、web-scraping、beautifulsoup

我希望从一个给定的网站使用Python3和BeautifulSoup提取所有表单。下面是一个执行此操作的示例，但无法提取所有表单：from bs4 import BeautifulSoup for form in forms: print('\n\n')

浏览 0提问于2017-03-27得票数 2

2回答

有什么方法可以从Selenium* RC连接数据库服务器吗？*

selenium

有人知道如何从Selenium RC连接DB吗？我需要运行许多具有不同角色访问权限的用户ID和密码。目前，我正在使用它作为一个HTML文件的数据套件。

浏览 4提问于2010-03-22得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

JavaScript和HTML的抓取

如何动态抓取页面数据？

如何在Javascript中预载声音？

Python -单击链接时抓取数据不会更改URL

如何加载站点的所有资源，包括AJAX请求等。在Python中？

在span标记中找不到元素

Python刮板没有在某些子域上返回完整的html代码

尝试将数据从网站加载到json文件中。

使用BeautifulSoup调用JAVA函数

在Python代码中获取的HTML与显示的网页不同

Python戴尔驱动程序下载

如何在Python中抓取动态加载的JavaScript页面？

为什么python和我的web浏览器对同一个链接显示不同的代码？

抓取返回生成html节点的javascript文件的ajax页面

如何从网站中抓取动态内容？

Python爬虫找不到存在的关键字

无法使用BeautifulSoup获取文章的urls

BeautifulSoup不会从网页中提取所有表单

有什么方法可以从Selenium* RC连接数据库服务器吗？*

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐