Scrapy xpath无法提取_xpath提取URL - Scrapy_使用xpath和scrapy提取图像 - 腾讯云开发者社区

python、xpath、scrapy

我正在尝试从link中提取数据，我使用 scrapy shell "https://www.newegg.com/Product/Product.aspx?Item=06T-0045-00045" 我得到了正确的响应，但不能让Xpath工作，即用response.xpath('//li[@class="price-current"]')返回空的价格，我也尝试了response.xpath

浏览 6提问于2019-05-13得票数 0

回答已采纳

2回答

刮伤xpath不捕获标记

xpath、tags、scrapy、html-lists

在这种情况下，我想让Scrapy提取出“圆形大小”。但事实证明，Scrapy无法捕捉dl下的任何子节点。response.xpath('//[@id="termsheet"]/div/section[1]/div/dl/li[2]/dt/span').extract() Xpath表达式是从Chome inspect我在Scrapy中启用了A

浏览 7提问于2016-06-06得票数 0

回答已采纳

1回答

我试图通过抓取和获取代码中的错误从网站的链接中提取数据

python-2.7、web-scraping、scrapy

我试图从一个网站的链接中提取数据。我要走的路是：-links import scrapy Profession = scrapy.Field() Die

浏览 1提问于2017-05-08得票数 0

回答已采纳

1回答

我正在使用scrapy xpath + re从网页中提取数据。字符是unicode (俄语)，并且所有要提取的字符串都包含长短划线(python代码'\u2014')，问题是我的正则表达式无法找到完整的字符串，并用长短划线将其拆分。对我来说真的很不方便。下面是我已经尝试过的一些例子，它们不起作用： response.xpath('some xpath goes here').re(r'[\w\s\\u2014\.,]+&

浏览 0提问于2015-06-05得票数 0

1回答

创建循环以解析scrapy中的表数据

web-scraping、scrapy

我正在使用下面的xpath选择器//*[@id="employee-table"]/tbody/tr，但它不起作用。

浏览 2提问于2017-04-21得票数 1

1回答

如何通过xpath获取元素

python、web-scraping、scrapy

我正在为网站设计一个使用python scrapy的刮板。 []

浏览 2提问于2020-04-13得票数 0

1回答

而抓取获取错误实例方法没有属性'getitem‘

python、web-scraping、scrapy、web-crawler、scrapy-spider

我无法理解我得到的这个错误->实例方法没有属性getitem。我只是试着刮这个网站，以提取部门名称。import scrapyfrom scrapy.selector import Selectorfrom scrapy.contrib.linkextractors.sgml import SgmlLinkExtractor from urlparse import urlj

浏览 3提问于2015-01-27得票数 1

回答已采纳

2回答

抓取抓取中的链接

python、scrapy

我试图建立一个广泛的连续爬虫，我能够提取链接，但我无法抓取他们和提取这些链接。该项目的最终目标是抓取.au域并将其根URL添加到数据库中。class Crawler (scrapy.Spider): rules = (Rule(LinkExtractor(allow='.com'), callback"http://quotes.toscrape.com/", d

浏览 0提问于2020-06-10得票数 0

回答已采纳

2回答

在Scrapy中有没有比XPath选择器更好的选择？

jquery、xpath、web-scraping、scrapy

像title said一样，在Scrapy中有没有更好的XPath选择器，可以用来轻松地选择html中的数据？我发现XPath有很高的学习曲线，它的语法有点难以使用。我觉得如果jQuery选择器可以在Scrapy中使用或合并，它可以让生活变得更容易。

浏览 0提问于2014-12-17得票数 0

1回答

刮伤不是爬过链接

python、web-scraping、scrapy

我是用链接提取器抓取链接，我使用的是正确的XPath表达式，但我不知道为什么它会无限大，打印某种源代码，而不是餐馆的名称和地址。我知道在我的限制XPath表达式中有一些错误，但是无法知道它是什么。代码：from scrapy.linkextractors import LinkExtractor ) def parse_

浏览 5提问于2021-12-14得票数 0

回答已采纳

1回答

刮擦蜘蛛不跟随链接

python、scrapy、scrapy-spider

当我在scrapy shell http://www.nytimes.com中实例化链接提取器时，它成功地用le.extract_links(response)提取了一个文章urls列表，但是除了主页之外，我无法获得爬行命令(scrapy crawl nyt -o out.json)来抓取任何东西。from scrapy.contrib.spiders import Rule from

浏览 4提问于2015-06-18得票数 3

回答已采纳

2回答

如何从网站上抓取所有的数据？

web-scraping、beautifulsoup、scrapy

有人能告诉我为什么要这样提取吗?我很感谢你的help.How，我可以正确地提取它吗？import scrapy title = scrapy.Field() Revenue2015 = scrapy.Field() Website = scrapy<

浏览 45提问于2017-05-13得票数 1

回答已采纳

1回答

条件URL抓取

python、xpath、scrapy

我试图在一个我不知道网址结构的网站上使用Scrapy。 scrapy crawl dmoz>test.txtfrom scrapy.

浏览 5提问于2016-07-27得票数 1

1回答

从在Chrome dev工具中工作的表中提取<a>标记，但不是在scrapy* shell上*

python-2.7、web-scraping、scrapy、scrapy-spider

我正在尝试提取论坛中所有帖子的标题()但是，相同的xpath在scrapy shell中不起作用。附件是chrome devtools的工作演示 

浏览 2提问于2018-02-21得票数 0

3回答

在Scrapy中，如何设置每个url的时间限制？

python、scrapy

我正在尝试抓取多个网站使用Scrapy链接提取器，并遵循为真(递归)。寻找一个解决方案，以设置时间限制爬行为每个网址在start_urls列表。谢谢 title = scrapy.Field()

浏览 39提问于2016-07-28得票数 1

2回答

Scrapy不接受爬虫中的日语字符

python、python-2.7、scrapy

"> <ruby>株式会社エリア・エステート　川崎店</ruby></td># -*- coding: utf-8 -*- name = "tes

浏览 0提问于2017-07-10得票数 0

1回答

Scrapy - xpath提取程序返回空。

python-3.x、xpath、scrapy

我的目标是构建一个从的表中提取数据的刮板。import scrapy # overview details wallet = scrapy.Fieldscrapy.Item['wallet'] = sel.xpath('td[2]/a/text()').e

浏览 0提问于2018-11-03得票数 0

1回答

从网站上抓取桌子时遇到的问题？

python、xpath、web-scraping、scrapy、scrapy-spider

我正在努力从这个网站中提取表格。虽然我匹配xpath并发现了表的字段，但我无法从站点中提取任何内容，这就是我的蜘蛛的样子：import scrapy name = "table1" 'wesite.com#/&#x

浏览 1提问于2016-10-27得票数 1

回答已采纳

1回答

如何检查来自xpath的url是否存在？

scrapy

我在Scrapy中有两个函数 def parse_attr(self, response): item= Item() item['Title'] = response.xpath('').extract()

浏览 8提问于2019-02-07得票数 0

回答已采纳

1回答

如何用scrappy抓取整个网站，抓取python 3中每个网页的数据

python-3.x、web-scraping、scrapy、anaconda

我正在尝试爬行一个网站，并使用scrapy从python3中的每个网页中抓取一些数据。我已经通过提供url来抓取单个页面的数据，但现在我想要抓取每个页面的数据。我认为我遗漏了一些东西，因为我的代码无法抓取数据，因为它无法提取数据。我已经尝试了下面的代码，但没有成功。我被困在这里了，所以请帮助我，我正在使用带有pycharm编译器的anaconda3from scrapy.crawler import CrawlerProcess fromscrapy

浏览 0提问于2018-06-21得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云