使用Scrapy在<style>标签上提取背景url

文章/答案/技术大牛

发布

1回答

、、、

我在试着刮擦scarpy的标签样式： #main_container { background: #f50 url('https://google.com/sample.jpg') top

浏览 32提问于2020-08-11得票数 0

回答已采纳

2回答

在scrapy : Python中获取重定向url时出错

、、、

yield{ "Download_URL":redirected_URL,要获得重定向的url及其标头，但是scrapy提供了调试：302) to <GEThttps://example.

浏览 0提问于2018-07-29得票数 0

回答已采纳

2回答

在所有项目加载后更新后台

、、、

我有一个问题，我的网页应用程序加载一个大的图像作为背景。它应用在<style>标签上的body标签上。它可以工作，但当打开页面时，会在图像加载时显示白色背景。我希望能够在图像加载时将background-color设置为特定的蓝色，因此我执行了以下操作： <script type="text/javascript">="url('img/form_bg.j

浏览 0提问于2015-01-12得票数 1

回答已采纳

1回答

使用Scrapy时出现奇怪的错误

、、

它提取url start_urls并将其放置在data.json中。下面是我使用的代码：from scrapy.contrib.spiders import Rule url = scrapy.Field(

浏览 1提问于2014-12-26得票数 0

回答已采纳

2回答

在react组件上设置样式背景图像

、、

我正在使用内联风格来改变化身背景-图像。const avatarStyle ={}; 但是这段代码并没有在这个标签上设置任何样式。

浏览 0提问于2017-04-26得票数 2

回答已采纳

2回答

[Python和Scrapy]

、、、

我注意到，当点击“完整详细信息”按钮时，URL保持不变。下面是我的代码： import scrapy class FirstSpider(scrapy.Spider不确定这是否会有帮助，但这是弹出/花哨的框窗口： popup window 我是否需要使用Selenium来单击按钮，或者我只是遗漏了什么？任何帮助都将不胜感激。

浏览 34提问于2020-12-26得票数 3

回答已采纳

3回答

HTML背景重复

、、

我有一个问题，我有一个非常好的背景，我在photoshop中制作的，当我在超文本标记语言<body background = "images/bg1.png">中设置为背景时，它到处重复，看起来真的很迟钝

浏览 2提问于2012-08-20得票数 0

回答已采纳

1回答

在使用Selector的Scrapy中，什么是等效的value_of_css_property？

、、、、

从这个标签中获取背景信息我在Selenium中使用<

浏览 9提问于2016-12-30得票数 1

回答已采纳

4回答

Web-刮取与Scrapy的链接

、、

我在使用Scrapy提取特定链接时再次遇到问题。data-flight="control"> </a>url = response.css('div.testclass

浏览 0提问于2018-10-12得票数 0

回答已采纳

2回答

我正试图在亚马逊上构建一条关于“与此项目相关的赞助产品”的规则，但是，每个产品的ASIN都嵌入到xpath //ol/li/div/@data-asin中，我希望从其中生成以下链接格式f"https://www.amazon.com/dp/{ASIN} (对于与此项目相关的赞助产品中的每一项) scrapy shell https://www.amazon.com/gp/product/B07PB5M8DSfr

浏览 0提问于2019-07-25得票数 0

回答已采纳

1回答

条件URL抓取

、、

我试图在一个我不知道网址结构的网站上使用Scrapy。 scrapy crawl dmoz>test.txt from scrapy.selectorimport HtmlXPathSel

浏览 5提问于2016-07-27得票数 1

1回答

如何在scrapy* spider运行时获取新的令牌头*

、、

我正在运行一个抓取蜘蛛，它首先从我抓取的网站获取授权令牌，使用基本请求库。用于此的函数称为get_security_token()。此令牌作为标头传递给scrapy请求。问题是令牌在300秒后过期，然后我得到一个401错误。爬行器是否可以看到401错误，再次运行get_security_token()函数，然后将新的令牌传递给所有未来的请求头？import scrapy name = 'player

浏览 12提问于2020-08-04得票数 0

3回答

Scrapy，仅遵循内部URLS，但提取找到的所有链接

、、、、

我想从一个给定的网站使用Scrapy获得所有外部链接。使用下面的代码，爬虫也会抓取外部链接：from scrapy.contrib.linkextractorscallback="parse_obj", follow=True), item = someItem() item['<

浏览 0提问于2015-01-15得票数 16

回答已采纳

2回答

如何修复Scrapy在深度爬行中不起作用

、、、、

我目前正在尝试使用scrapy创建一个小型的web抓取原型。我目前的问题与链接提取和跟踪相关。这是我正在使用的蜘蛛： session_id = -1 for url in listurl: #make scrapy follow only the current

浏览 2提问于2017-03-01得票数 1

2回答

使用php在邮件内容中设置背景图片

我想知道如何使用php在邮件内容中设置背景图片。目前我有发送电子邮件的php代码，但它没有背景图片。希望大家能帮助我。Ponomy

浏览 1提问于2010-11-25得票数 0

1回答

使用Scrapy* for获取CSS样式表上的背景图像*

、、、、

我开始使用Scrapy，一个Python的爬行库。在搜索了很多之后，我仍然没有找到在CSS样式表中爬行背景图像的方法。例如，假设我需要来自这个的商店映像的url。通过检查它，我意识到我需要的图像URL在这里(在CSS样式表中)：.store-page .image-store-hero{ background-image: url(&quo

浏览 4提问于2015-10-08得票数 4

回答已采纳

2回答

Scrapy:从get请求中抓取数据

、、、、

我正在尝试用scrapy从中抓取数据。但是当我在shell中尝试view( response )时，一些响应丢失了。但是请求失败的原因是有没有办法在scrapy中手动执行get请求来获取json文件？

浏览 38提问于2019-08-10得票数 0

回答已采纳

2回答

如何从XML页面中提取urls，加载它们并使用提取其中的信息？

、、

我使用Scrapy的XMLfeedspider从页面xml中提取信息。我试图只提取标签"loc“中该页上的链接，并加载它们，但阻止页面重定向，然后将其发送到将从该页收集信息的最后一个解析节点。问题是，我不确定是否可以在"def star_urls“上加载这些页面，或者是否需要使用parse_node并将其重定向到另一个解析以提取我需要的信息，但是即使我尝试了，也不知道如何从xml页面中提取链接继续我的想法：方法应该是加载并从其中<

浏览 2提问于2017-07-20得票数 1

回答已采纳

1回答

Python:无限期运行刮伤蜘蛛来监视页面更改

、、

我只使用了一个蜘蛛，所以我的代码如下所示： name = 'page_monitor' sitemap_urls

浏览 3提问于2017-09-26得票数 1

回答已采纳

1回答

需要最简单的方法来用来自MySQL的照片来更改标题的背景

、、、

我需要最简单的方法来使用我通过表单代码插入到MySQL中的照片。这部分工作(我认为)和照片是在MySQL数据库中的文本格式‘Photo.jpg’‘。但是，我一直在努力从数据库中提取它，并通过mysql_fetch_assoc将其作为标题的背景，以显示其他数据。其他数据效果很好，但我想不出这张照片.如果有人有办法做这件事，那就尽量简单和简短。<header class="masthead" style="background-image: url

浏览 3提问于2022-06-13得票数 0

点击加载更多