scrapy如何解决动态js_scrapy 抓取动态js_scrapy js动态网页 - 腾讯云开发者社区

、、、

我试图寻找解决方案，但所有我读到的材料都涉及到一些区别的网址(页号、文本等)。如何从https://www.baincapital.com/people中提取出所有的名字。到目前为止我的代码是：from scrapy_splash import SplashRequest class BainPeople(scrapy.Spider):col-md-6.col-lg-3.grid.staff a::attr(href)').extr

浏览 2提问于2020-02-05得票数 0

回答已采纳

2回答

Scrapy支持JavaScript进行网络爬行吗？

、、、

我听说scrapy不支持javascript。我想知道我是否可以使用scrapy抓取我们内部网站的链接，我们的内部网站有javascript，我相信当你点击一个链接时它就会生成，但我不是100%确定。我还能不能用scrapy的爬虫抓取每个链接？如果我不能，你能推荐另一个我可以使用的工具吗？支持javascripts和post身份验证登录(Https)。谢谢!

浏览 2提问于2013-07-16得票数 0

1回答

安装docker后运行scrapy时出错

、、、

我想使用scrapy从动态内容中抓取。我从网上得到，我必须安装docker。但在安装之后，我总是在运行时出现错误：或其他scrapy命令。这是错误：然后我尝试安装pypiwin32，也出现了一个错误：如何解决？

浏览 2提问于2017-07-07得票数 0

2回答

Scrapy:如何从<span>中提取属性值

(200) <GET https://twitter.com/ADP> (referer: None)2018-10-18 10:22:16 [scrapy.core.engine] INFO: Closing spider (finished) 2018

浏览 0提问于2018-10-18得票数 1

回答已采纳

1回答

使用scrapy从facebook中抓取数据

、、、

因此，在抓取这个url之前，我通过scrapy登录，然后通过这个结果页面登录。但是，即使这个页面的http响应是200，它也不会丢弃任何数据。守则如下：from scrapy.spider import BaseSpiderfrom scrapy.selectorimport HtmlXPathSelector from scrapy.contrib.spiders import CrawlSpider, R

浏览 3提问于2013-05-31得票数 5

3回答

如何发送在Scrapy中启用的JavaScript和Cookie？

、、、

我正在刮一个网站使用Scrapy，这需要烹饪和java-script才能启用。我不认为我必须实际处理javascript。我所要做的就是假装javascript已经启用。CookieCOOKIES_DEBUG = TrueDOWNLOADER_MIDDLEWARES = { '

浏览 0提问于2013-05-06得票数 9

1回答

Scrapy + Python + Xpath : Xpath返回一个空列表

、、、

我需要从这个页面中抓取到图片的链接：我编写了这个xpath：它返回了空列表。它应该返回到gif和jpg文件的链接。为什么？

浏览 0提问于2018-09-21得票数 0

回答已采纳

1回答

不定域数

、、、、

但是，如何动态地创建scrapy.Field()元素来处理这个问题呢？或者你不需要还是？为了简单起见，假设我是在刮随机人物的个人资料页。如何根据需要动态创建尽可能多的pet字段？name = scrapy.Field()height = scrapy.Field()# pet1 = scrapy.Field() # pet

浏览 0提问于2018-07-25得票数 0

1回答

抓取蜘蛛在URL中导航的麻烦

、、

我一直在努力寻找解决这个问题的方法：(我可能显示的功能不起作用，而且是错误的，但我对这个过程的困惑越多)。任何帮助都是非常感谢的。from gc import callbacksfrom scrapy.spiders import CrawlSpider, Rule from scrapy.linkextractors

浏览 2提问于2022-10-23得票数 1

回答已采纳

1回答

如何使用scrapy或selenium抓取动态页面？

、、、、

我正在尝试抓取web动态页面，但使用scrapy时，我不能检索所有信息，因为我想要的信息是动态的。我试着使用Selenium，但与Scrapy不同的是，你不能指定头部，网站阻止了我。我有一个带有验证码解算器的页面(用脚本很难解决重新验证码)，因为网站会检测到我是机器人。我想拥有所有的动态信息，并有权访问网站，但不可能与selenium和scrapy没有给我所有我想要的信息，我认为这是因为当scrapy阅读它时页面没有完全加载。

浏览 23提问于2019-06-13得票数 0

2回答

Scrapy:谁能告诉我为什么这段代码不能让我抓取后面的页面？

、

我是一个初学者，正在学习如何在Python中使用Scrapy进行网络抓取。有人能指出哪里出了问题吗？我的目标是抓取所有后续的页面。from indeed.items import IndeedItem name = "indnext_page_extension is not None: next_page = response.urljoin(next_page_extension

浏览 27提问于2021-04-25得票数 3

3回答

无需显式定义要抓取的每个字段即可抓取数据

、

我希望抓取一页数据(使用Python Scrapy库)，而不必在页面上定义每个单独的字段。相反，我希望使用元素的id作为字段名来动态生成字段。对我来说解决这个问题的最好方法是什么？

浏览 1提问于2011-02-22得票数 9

回答已采纳

1回答

如何在旋转代理中使用scrapy* splash？*

、、、、

我仅通过使用以下内容作为请求才能成功抓取js内容。def start_requests(self): yield scrapy.Request(self.parse, ) 如何

浏览 10提问于2017-08-14得票数 1

3回答

scrapy能像Selenium一样控制和显示浏览器吗？

、、

当我使用Selenium时，我可以看到浏览器GUI，是否可以使用scrapy或严格基于scrapy命令行？

浏览 4提问于2015-11-03得票数 1

回答已采纳

2回答

为什么我不能在Scrapy中解析响应？

这是代码：name = 'lazada' allowed_domains = ['lazada.com.my

浏览 19提问于2020-10-28得票数 0

2回答

使用嵌套框架和javascript进行Web抓取

、、、、

marginwidth="0" marginheight="0" frameborder="no" ></frameset>我也在寻找一个在Windows和Linux上工作良好的解决方案。

浏览 0提问于2014-01-15得票数 0

1回答

用JS流行Python刮取数据

、、

我想知道，我们能否从使用Python生成的页面上弹出的弹出中刮取特定字段的数据？如果是，请建议。

浏览 5提问于2017-02-10得票数 0

2回答

将信息从Scrapy爬虫持续导出到Django应用程序数据库的最佳方法是什么？

、、、

我正在使用Scrapy框架执行抓取，虽然有一个实验性的，但我宁愿远离它，因为它是不稳定的。现在，我的计划是用Scrapy的XMLItemExporter (docs )创建爬行项的XML文件，并将这些文件作为XML (docs )使用到Django项目中。当可能有一个更好或更容易的解决方案时，我花了太多的时间在这上面，例如直接导出到数据库，在本例中是MySQL。似乎没有人在网上写过这个过程，奇怪的是，在我看来，Scrapy是一个很好的框架，可以插入Django应用程序。实验DjangoItem的存在表明Scrapy

浏览 3提问于2011-07-29得票数 6

1回答

刮蜘蛛精刮工艺不刮任何东西

、、

这是完整的蜘蛛import reimport randomfrom genericScraper.items import GenericItem2019-01-31 22:49:26 [scrapy</

浏览 1提问于2019-02-01得票数 2

回答已采纳

2回答

Scrapy:提取数据(css-selector)

、、

scrapy shell https://www.indiegogo.com/projects/functional-footwear-run-pain-free#/ response.css('.t-h3

浏览 1提问于2020-08-03得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何在使用无限滚动加载的页面中刮取完整列表，每次请求的URL是相同的

Scrapy支持JavaScript进行网络爬行吗？

安装docker后运行scrapy时出错

Scrapy:如何从<span>中提取属性值

使用scrapy从facebook中抓取数据

如何发送在Scrapy中启用的JavaScript和Cookie？

Scrapy + Python + Xpath : Xpath返回一个空列表

不定域数

抓取蜘蛛在URL中导航的麻烦

如何使用scrapy或selenium抓取动态页面？

Scrapy:谁能告诉我为什么这段代码不能让我抓取后面的页面？

无需显式定义要抓取的每个字段即可抓取数据

如何在旋转代理中使用scrapy* splash？*

scrapy能像Selenium一样控制和显示浏览器吗？

为什么我不能在Scrapy中解析响应？

使用嵌套框架和javascript进行Web抓取

用JS流行Python刮取数据

将信息从Scrapy爬虫持续导出到Django应用程序数据库的最佳方法是什么？

刮蜘蛛精刮工艺不刮任何东西

Scrapy:提取数据(css-selector)

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐