腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
在
Splash
中
使用
Lua
脚本
访问
google.com
的
DOM
、
、
我正在尝试
在
Splash
中
运行
Lua
脚本
来执行Google搜索,并截取搜索结果
的
屏幕截图。当我尝试
在
Lua
脚本
中
使用
xpath或css选择器选择Google搜索框时,我得到了这个错误: { "type": "ScriptError", "description
DOM
Except
浏览 83
提问于2020-10-12
得票数 1
1
回答
刮擦-等待页面加载
的
飞溅
、
、
、
我对刮擦和飞溅很陌生,我需要从单个页面和常规
的
web应用程序
中
抓取数据。不过,有一点要注意
的
是,我主要是从内部工具和应用程序
中
抓取数据,所以有些工具和应用程序需要身份验证,而且所有这些都需要至少几秒钟
的
加载时间才能完全加载页面。然后,我了解了
LUA
脚本
作为这些请求
的
参数,并尝试了
使用
不同形式
的
wait()形式
的
LUA
脚本
,但看起来这些请求实际上从未运行过
L
浏览 0
提问于2019-08-30
得票数 0
回答已采纳
1
回答
如何用scrapy_
splash
包重定向表单后
的
帖子?
、
、
、
我
使用
Python、Scrapy、
Splash
和scrapy_
splash
包来废弃网站。
在
门户页面上,有一个表单元素包装了许多按钮。单击时,将更新操作URL,并触发表单提交。表单提交导致302重定向。我
在
SplashRequest
中</
浏览 3
提问于2017-05-18
得票数 2
回答已采纳
2
回答
从
Splash
请求读取cookie
、
、
、
在
使用
Splash
提出请求之后,我正在尝试
访问
cookie。下面是我如何构建请求
的
方法。script, }该
脚本
是
Splash
文档
的
精确副本。因此,我试图
访问
设置在网页上
的
cookie。当我不
使用
Splash
时,下面的代码会像我所期望
的
那样工作,而不是
浏览 2
提问于2017-01-03
得票数 4
3
回答
在
python
中
执行SplashRequest时添加等待元素
、
、
、
、
我试图刮几个动态网站
使用
Splash
在
python抓取。但是,
在
某些情况下,
Splash
无法等待整个页面的加载。解决这个问题
的
一种蛮力方法是增加大量
的
wait时间(例如。在下面的片段
中
5秒)。但是,这是非常低效率
的
,仍然无法加载某些数据(有时加载内容需要超过5秒)。是否存在某种等待元素条件,可以通过这些请求进行处理?
浏览 6
提问于2016-12-10
得票数 16
回答已采纳
1
回答
Scrapy:如何从
splash
中
获取cookie
、
、
我正在尝试从开机启动请求
中
获取cookie,但我一直收到错误。下面是我
使用
的
代码: name = 'p2peyeSpider' allowed_domains = ['p2peye.com'yield SplashRequest(url, callback=self.parse, endpoint='render.html',args={'wait': 1, '
lua</
浏览 21
提问于2018-08-01
得票数 1
2
回答
将表从Python
脚本
传递到ScrapySplash
、
、
、
我正在运行ScrapySplash,并试图将在
Lua
中
创建
的
一个表传递给Parse方法。如果我试图
访问
这个表,我会得到一个类型错误:'SplashJsonResponse‘object is not subscriptable’。我
的
Lua
脚本
如下: function main(
splash
, args) assert(
浏览 2
提问于2020-03-26
得票数 0
1
回答
如何确保scrapy-
splash
成功渲染了整个页面?
、
、
、
、
当我爬行整个网站时发生
的
问题,
使用
splash
来渲染整个目标Page.Some页面没有随机成功,所以我是假
的
,以获取信息,支持存在时,渲染作业有Done.That意味着我只是从渲染结果
的
一部分信息,虽然我可以从其他渲染结果获得全部信息以下是我
的
代码: sett
浏览 12
提问于2017-03-28
得票数 3
1
回答
如何保存飞溅
的
cookie
、
、
、
、
我目前正在尝试抓取一个网站,并试图
在
抓取
的
同时保持登录状态。不幸
的
是,据我所知,
splash
会在每次splashrequest时重置cookie。我正在
使用
splash
和scrapy来抓取一个javascript站点。我
的
问题是:我如何防止我
的
cookies被重置?
在
我自己在网上寻找解决方案后,我知道它与
lua
脚本
或cookie中间件有关,但我不知道如何
使用
它们。如果有人能帮上忙,
浏览 64
提问于2021-03-03
得票数 0
1
回答
我只想
使用
启动
脚本
,只返回工作列表
的
urls
、
、
、
、
我正在
使用
scrapy和
splash
来抓取网站,出于某些原因,我
使用
splash
和scrapy,尽管我知道我可以抓取它
的
应用程序接口。我
的
问题是,我只希望我
的
lua
脚本
只返回工作列表
的
urls,而不是整个
splash
:html()页面,我一直
在
尝试这样做,但我得到了下面的错误消息: "error": 400, ""mes
浏览 2
提问于2020-05-26
得票数 1
1
回答
Scrapy
Splash
单击带有javascript href
的
链接
、
我正在
使用
Scrapy
Splash
抓取一个包含如下元素
的
页面: 第1页,共349页 1|2|3|4|5|6|7|8|9| 10 |下一步> 我想‘点击’锚与文本‘下一步’,并让javascript这是我
的
刮刀
的
样子: script = """
splash
:init_cookies(
splash
.args.cookies)cookies={
浏览 29
提问于2019-02-16
得票数 1
回答已采纳
1
回答
使用
Scrapy和
Lua
在
mouseclick上动态加载内容
、
、
、
、
我有一个飞溅刮刀和
Lua
脚本
。
Lua
脚本
目前只
在
页面上启动滚动,以便在搜索页上加载更多结果。从搜索页面导航到我刮过
的
详细页面。但是,
在
细节页面上,照片旋转木马还没有出现在
DOM
中
,当用户单击#showphotos元素时就会动态加载它。:html() end因为我对
Splash
和
Lua
非常陌生,所以
浏览 6
提问于2020-12-20
得票数 0
2
回答
Splash
不
使用
文档
中
描述
的
三种方法
中
的
任何一种连接到代理。
、
、
、
Splash
浏览器不会通过http代理向其发送任何内容。即使代理没有运行,页面也会被获取。
在
python 3
中
,我
使用
带有scrapy
的
方法来获取Angular.js网站认证后
的
页面。该
脚本
能够在身份验证后获取页面、身份验证和获取页面。但是,它不
使用
本地主机上
的
代理设置:8090和wireshark确认来自端口8050
的
通信量流向50k范围内
的
某个端口。安装程序
在
端口8050 -
浏览 0
提问于2019-07-31
得票数 0
1
回答
如何从命令提示符将变量传递给
在
scrapy
中
执行
的
lua
脚本
?
、
、
、
我试图
在
scrapy
中
作为用户定义参数传递一个变量,这个变量将用于
lua
脚本
的
for循环,我
的
代码如下所示:from scrapy_
splash
import SplashRequest,当我
使用
一个接口运行
lua
脚本
的
for循环(即for i=1,5,1 )时,
脚本
工作得很好,但是当我试图
使用
scrapy crawl allprod
浏览 10
提问于2020-10-12
得票数 0
回答已采纳
1
回答
刮擦--用Tor喷溅
、
、
、
、
我已经成功地
使用
以下链接运行了Scrapy和Tor:HTTP_PROXY = 'http://127.0.0.1:8123'socksParentProxy = localhost:9150 diskCacheRoot="
浏览 2
提问于2017-02-16
得票数 4
回答已采纳
2
回答
飞溅记忆极限(刮擦)
、
我是从码头开始
的
。我为
splash
和scrapy创建了一个很大
的
lua
脚本
,然后运行,我发现了问题:
Lua
:__gc元方法
中
的
错误(/app/
splash
/
lua
_ much /sandbox.
lua
:189:
脚本
使用
太多内存我怎么能增加飞溅
的
记忆呢?
浏览 0
提问于2017-06-01
得票数 3
回答已采纳
1
回答
scrapy-
splash
脚本
找不到CSS选择器
、
、
我正在尝试创建一个scrapy-
splash
脚本
,以便从以下位置获取食品链接: 当您第一次
访问
它时,它会让您选择一个地域。我之所以
使用
splash
,是因为carousel是由javascript创建
的
,而常规
的
请求和解析不会在html
中
显示它。我
的
问题是,我没有得到任何数据到我
的
‘项目’字典。顺便说一句,我也
在
docker控制台上运行了
splash
。如果我
在
浏览
浏览 0
提问于2017-07-05
得票数 0
1
回答
Lua
脚本
无法单击按钮
、
、
、
我正在尝试
使用
这个
lua
脚本
通过scrapy-
splash
从link
中
抓取航班: function main(
splash
) assert(
splash
:go(
splash
.args.url)):html() end 出于某种原因,我得到了这个错误: '
LUA
浏览 36
提问于2019-02-22
得票数 1
1
回答
如何用SplashRequest
在
scrapy_
splash
中发送post请求
、
、
我尝试将SplashRequest与端点=‘execute’一起
使用
下面的代码发送post请求,但是结果显示我没有成功。import CrawlerItem name = "test" assert(
splash
:go(args.url)) assert(
splas
浏览 3
提问于2017-10-25
得票数 0
回答已采纳
2
回答
Splash
不会执行
lua
脚本
、
、
我遇到了一个问题,我
的
Lua
脚本
拒绝执行。从ScrapyRequest调用返回
的
响应似乎是一个HTML,而我期待
的
是一个文档标题。我假设
Lua
脚本
从未被调用,因为它似乎对响应没有明显
的
影响。我已经
在
文档
中
挖掘了很多东西,而且似乎不太清楚这里缺少什么。有人有什么建议吗?= urljoin(GOOGLE_BASE_URL, GOOGLE_QUERY_PARAMETERS) GOOGLE_SEARCH_QUERY = &
浏览 4
提问于2016-08-12
得票数 4
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Lua脚本编程艺术:在公司员工电脑监控软件中嵌入脚本的代码实现方法
redis实现可重入分布式锁
GopherLua基础入门
让我直接涨薪5K的Nginx/OpenResty详解,NginxLua操作Redis有多牛
【Python3网络爬虫开发实战】7.3-Splash负载均衡配置
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券