腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Scrapy
/
Splash
单击
按钮
,
然后
在
新窗口
中
从新
页面
获取
内容
、
、
、
我正面临一个问题,当我点击一个
按钮
,
然后
Javascript处理操作,
然后
它重定向到一个带有
新窗口
的新
页面
(这类似于你用目标_Blank点击<a> )。
在
scrapy
/
splash
中
,我不知道如何
从新
页面
获取
内容
(我的意思是我不知道如何控制新
页面
)。 任何人都可以提供帮助!script = """
浏览 26
提问于2019-01-05
得票数 1
回答已采纳
1
回答
Scrapy
-
Splash
获取
动态数据
、
、
、
我正在尝试从这个
页面
(以及其他
页面
)
获取
动态电话号码:https://www.europages.fr/LEMMERFULLWOOD-GMBH/DEU241700-00101.html
在
带有类page-actionclick-tel的元素div上
单击
后,将显示电话号码。我正在尝试通过
scrapy
_
splash
使用LUA脚本执行
单击
操作来
获取
这些数据。
在
我的ubuntu上启动<
浏览 21
提问于2021-10-13
得票数 0
1
回答
如何将scrapyjs函数集成到
Scrapy
项目中
、
、
、
、
我使用scraper制作了一个网络刮刀,从
获取
音乐会门票数据。我已经能够成功地从
页面
上每个票证的元素
中
刮取数据,除了只能通过
单击
“票证”
按钮
进入票务
页面
并从
页面
上的票证
中
抓取票价才能访问的价格之外。经过广泛的谷歌搜索,我发现
Scrapy
.js (以
Splash
为基础)可以
在
Scrapy
中
与
页面
上的JavaScript交互(比如需要
单击</
浏览 2
提问于2015-06-29
得票数 6
1
回答
Scrapy
+
splash
:无法选择元素
、
、
、
、
作为练习,我尝试访问,点击地址文本框,输入一个位置,
然后
按enter
按钮
移动到包含该位置可用餐馆的下一页。
在
splash
中
,我得到以下错误消息: "info": {function ma
浏览 2
提问于2017-01-13
得票数 3
回答已采纳
1
回答
如何使用
Scrapy
和
Splash
处理分页,如果
按钮
的href为javascript:void(0)
、
、
、
我正试图从这个网站:
中
抓取大学的名称和链接,并且
在
处理分页时遇到了一个问题,因为指向下一页的
按钮
的href是javascript:void(0),所以我无法用
scrapy
.Request()或response.follow此网站的URL不包含params,如果
单击
下一个
页面
按钮
,URL将保持不变,因此我无法通过更改URL来处理分页。下面的代码片段只能在第一页和第二页
获取
大学的名称和链接:from
浏览 9
提问于2022-05-12
得票数 -1
回答已采纳
1
回答
刮擦-等待
页面
加载的飞溅
、
、
、
我对刮擦和飞溅很陌生,我需要从单个
页面
和常规的web应用程序
中
抓取数据。不过,有一点要注意的是,我主要是从内部工具和应用程序
中
抓取数据,所以有些工具和应用程序需要身份验证,而且所有这些都需要至少几秒钟的加载时间才能完全加载
页面
。
然后
,我了解了LUA脚本作为这些请求的参数,并尝试了使用不同形式的wait()形式的LUA脚本,但看起来这些请求实际上从未运行过LUA脚本。它马上就完成了,我的HTMl选择器找不到我要找的东西。我在这里遵循的指导,并让它们的docker实例
在
localhost上运
浏览 0
提问于2019-08-30
得票数 0
回答已采纳
1
回答
用
Scrapy
-
Splash
加载一个巨大的网页
、
、
、
、
问题有关
页面
内容
的更多详细信息我的想法是按‘title=’的“Mehr anzeigen”
按钮
的次数,因为它是需要的所有24.453记录显示
在
页面
上。一旦完成,我将能够解析
页面
并收集所有记录。首先,我尝试编写一个实现Selenium的
Scrapy
蜘蛛来呈现动态
浏览 0
提问于2018-03-20
得票数 0
回答已采纳
1
回答
从从chrome扩展打开的窗口捕获活动面板
中
的屏幕
、
我创建了一个
页面
事件google扩展,当按下扩展的弹出式
按钮
时,它创建了一个
新窗口
。我不想通过按下
新窗口
中的
按钮
从活动面板
中
获取
屏幕截图。我通过向后台
页面
发送一条消息来完成捕获,但我总是收到以下错误: 如果我理解正确的话,这个捕获应该
浏览 3
提问于2015-03-03
得票数 0
回答已采纳
1
回答
如何用
scrapy
_
splash
包重定向表单后的帖子?
、
、
、
我使用Python、
Scrapy
、
Splash
和
scrapy
_
splash
包来废弃网站。
在
门户
页面
上,有一个表单元素包装了许多
按钮
。
单击
时,将更新操作URL,并触发表单提交。表单提交导致30
浏览 3
提问于2017-05-18
得票数 2
回答已采纳
1
回答
使用
Scrapy
和
Splash
在
动态的JavaScript网页
中
刮取图像
、
、
、
、
我正在尝试刮从的高分辨率图像的链接,但高分辨率版本的图像只能在点击
页面
上的中等大小的链接时才能被检查,即在
单击
“
单击
此处以放大图像”(
在
页面
上,它是土耳其语)之后。但是,您知道
在
JS
页面
中
,您不能输入response.xpath("//blah/blah/@src")并
获取
一些数据。我安装了
Splash
(与Docker拉),并配置了我的
Scrapy
浏览 2
提问于2021-06-24
得票数 0
回答已采纳
1
回答
呈现使用框架集的
页面
、
、
、
、
我正在使用
scrapy
+
splash
为我的大学抓取网站。其中一些
页面
很古老,使用了我不熟悉的技术。我注意到有几个站点没有完全渲染。所有不完整的
页面
都使用<frameset>而不是传统的<body>。通过启动的gui,
页面
似乎完全呈现(我可以看到快照),但html不包含来自frame src的
内容
。下面是一些代码来说明我的问题:from
scrapy
_
splash
import
浏览 16
提问于2018-03-04
得票数 0
回答已采纳
3
回答
在
新窗口
中显示JSON
、
(当用户填写表单
中
的所有字段时,
按钮
将变为启用状态,并以指定的格式显示JSON (我这样做了))。我翻译成JSON,但不知道如何输出它…我正在考虑创建新的html
页面
,并在第一页的
按钮
上做window.open,但它不读取第一页用户输入的数据。或者我应该以某种方式将它保存在JSON文件
中
,
然后
从其他
页面
读取它?> <button type="submit" id="btn" class="btn"
浏览 4
提问于2013-05-28
得票数 0
2
回答
scrapy
没有检测到html元素,但是它在源
页面
上是可见的。
、
、
、
、
我有一个
在
普通浏览器上正常工作的请求,而不是
在
刮掉的shell
中
。当我使用"
scrapy
shell“或"
scrapy
爬行”时,整个HTML块就会消失。我不一定被禁止。下面是github上的问题(带图片),
然后
用mozilla这样的常规浏览器重定向到下面的链接(法语网站属性拍卖): 我哪里错过了重
浏览 3
提问于2016-07-10
得票数 2
1
回答
如何从使用javascript扩展
内容
的
页面
中
__scrape__所有信息?
、
、
我
在
试着刮具有元素列表和底部可增加列表的展开
按钮
的
页面
。它使用onclick事件进行扩展,但我不知道如何激活它。我正在尝试使用
scrapy
-
splash
,因为我读到它可能会工作,但我不能让它正常工作。expand
按钮
是
页面
底部的蓝色
按钮
,它的inspect显示了这个结果。 mostrar mais vagas
浏览 26
提问于2020-08-03
得票数 1
回答已采纳
1
回答
硒+刮屑
、
、
、
我正在尝试使用
scrapy
和selenium,以便能够与javascript交互,并且仍然拥有
scrapy
提供的强大的刮取框架。我编写了一个访问的脚本,
在
搜索栏
中
输入“阿姆斯特丹”,
然后
成功地点击搜索
按钮
。
单击
搜索
按钮
后,我希望
从新
呈现的
页面
中提取一个元素。不幸的是,
scrapy
不返回任何值。from
scrapy
.crawler import CrawlerProcess fro
浏览 4
提问于2017-01-10
得票数 2
回答已采纳
1
回答
如何从角度js打开
新窗口
中的外部URL并从控制器控制新打开的窗口
是否有方法
在
新窗口
中打开外部URL,并保持监视URL
在
新打开的窗口中更改并采取相应的行动。我也想
从新
开放的window.Basically
中
获得cookie值,我正在开发angularjs网站。例如,
在
单击
facebook
按钮
(使用passportjs进行社交登录)时,应该将用户重定向到facebook登录屏幕,一旦登录成功,用户将被重定向到一个
页面
,当重定向完成后,我将从服务器发送访问和刷新因此,我希望
在
重定向完成
浏览 0
提问于2016-05-10
得票数 1
回答已采纳
2
回答
刮擦,飞溅,点击
按钮
不工作
、
、
我想做的是
单击
按钮
后,会显示弹出式显示,并且可以看到电话。end没有
单击
按钮
,也没有显示电话号码。如果我们将item-phone-button替换为js-show-stat,则
单击
同一
页面
上的另一个字段可以正常工作。所以Javascr
浏览 0
提问于2018-03-14
得票数 3
回答已采纳
2
回答
由于.NET控件而导致的Window.Opener和按ID引用问题
、
、
我有一个.aspx
页面
,上面有一个链接,当
单击
它时,将使用window.open打开一个
新窗口
。如何
从新窗口
可靠地引用textbox的ID?我也安装了jQuery,但不确定是否可以
在
新窗口
中使用jQuery?
浏览 1
提问于2009-05-25
得票数 0
3
回答
使用登录页
在
Python中进行Web抓取
、
、
我正在尝试使用请求和漂亮的汤来访问我的学校成绩,但我
在
登录时遇到了很多问题。
浏览 24
提问于2019-09-08
得票数 0
回答已采纳
2
回答
Scrapy
和Instagram不返回任何
内容
、
、
我正在尝试从instagram图片中
获取
标签文本,例如:https://www.instagram.com/p/CHPoTitFdEz/,但是
Scrapy
没有返回任何
内容
。
在
我已经写过的
Scrapy
shell
中
: response.xpath('//span[@class=""]/a[@class="xil3i"]/text()').ge
浏览 31
提问于2020-11-28
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
走近代码之Python-爬虫框架Portia
功能比Scrapy强,却使用最方便的Gerapy分布式爬虫管理框架
想知道pdf怎么转换成excel吗 来试试这两个方法
电脑打不开网页怎么办?快看看是不是dns配置错误!
跟繁琐的命令行说拜拜!Gerapy分布式爬虫管理框架来袭!
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券