腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
如何
使用
splash
和
scrapy
将
变量
从
Lua
脚本
传递
到
Javascript
?
、
、
、
、
我当时正在做一个由
scrapy
和
splash
组成的抓取项目。我是
Lua
和
Javascript
的新手。我处于需要从
Lua
向
Javascript
发送
变量
的情况。但我不能弄清楚是怎么回事。下面是我的
Lua
脚本
script = """ assert(
splash</em
浏览 58
提问于2019-08-24
得票数 0
1
回答
如何
从命令提示符
将
变量
传递
给在
scrapy
中执行的
lua
脚本
?
、
、
、
我试图在
scrapy
中作为用户定义参数
传递
一个
变量
,这个
变量
将用于
lua
脚本
的for循环,我的代码如下所示:from
scrapy
_
splash
import SplashRequest
lua
脚本
的for循环(即for i=1,5,1 )时,
脚本
工作得很好,但是当我试图
使用
scrapy
crawl allproduc
浏览 10
提问于2020-10-12
得票数 0
回答已采纳
1
回答
Scrapy
-
Splash
如何
将
返回
变量
添加到响应
、
、
我想运行一个启动
脚本
,它在
lua
中做一些事情,然后
将
结果返回给我的
scrapy
机器人。但是,我只能接收html主体,而不能接收return语句中的任何
变量
。
splash
:go(...)--
lua
/
splash
stuffreturn { -- another SO thread stated that these have to be in JSON formatdoesn't work either wa
浏览 14
提问于2020-09-26
得票数 1
1
回答
启动
lua
脚本
进行多次单击
和
访问
、
、
、
我有一个
lua
脚本
,它将点击“引文”链接并加载模态窗口,然后得到引用的href格式的BibTeX格式。但是看到有多个搜索结果,因此有多个“引号”链接,我需要点击它们,并加载单独的BibTeX页面。我现在拥有的是:from
scrapy
_
splash
import SplashRequest f.write(response.css("body &
浏览 3
提问于2016-06-26
得票数 6
回答已采纳
1
回答
Scrapy
Splash
单击带有
javascript
href的链接
、
我正在
使用
Scrapy
Splash
抓取一个包含如下元素的页面: 第1页,共349页 1|2|3|4|5|6|7|8|9| 10 |下一步> 我想‘点击’锚与文本‘下一步’,并让
javascript
:get_cookies(), }""" class MySpider(
scrapy
.Spider'
scrapy
浏览 29
提问于2019-02-16
得票数 1
回答已采纳
1
回答
scrapy
-
splash
返回它自己的标头,而不是站点的原始标头。
、
、
、
现在我需要的是维护会话,所以我
使用
scrapy
.downloadermiddlewares.cookies.CookiesMiddleware,它处理set-cookie头。问题是:当我
将
splash
添加到图片中时,set-cookie打印就会消失,而实际上,作为响应头,我得到的是{'Date':'Sun,2016年9月25日12:09:55 GMT',‘Content’:'text/html;charset=utf-8','Server
浏览 1
提问于2016-09-25
得票数 7
回答已采纳
1
回答
刮擦-等待页面加载的飞溅
、
、
、
我对刮擦
和
飞溅很陌生,我需要从单个页面
和
常规的web应用程序中抓取数据。不过,有一点要注意的是,我主要是
从
内部工具
和
应用程序中抓取数据,所以有些工具
和
应用程序需要身份验证,而且所有这些都需要至少几秒钟的加载时间才能完全加载页面。基本上,SplashRequest
和
scrapy
.Request似乎都会运行并产生结果。然后,我了解了
LUA
脚本
作为这些请求的参数,并尝试了
使用
不同形式的wait()形式的
LUA</e
浏览 0
提问于2019-08-30
得票数 0
回答已采纳
1
回答
如何
从
scrapy
-
splash
中获取200以外的状态代码
、
、
、
我试图得到请求状态代码与刮痕
和
刮擦-飞溅,下面是蜘蛛代码。class Exp10itSpider(
scrapy
.Spider): urls, meta={'handle_httpstatus_all': True,'
splash
': { 'ht
浏览 14
提问于2017-10-19
得票数 3
回答已采纳
3
回答
如何
到达一个非常深嵌套的A HREF为我的蜘蛛找到下一个按钮?
、
、
、
、
具有讽刺意味的是,除了表
和
I感兴趣的表之外,所有标签都没有任何类或id。但是由于一些奇怪的原因,当我尝试
使用
scrapy
访问它时,我得到了以下结果:[]你知道我做错了什么吗?是因为它在< td >中,以及一堆<a >,嵌套在< tr >、< table >、许多< div >
和
一个< form >中吗? 谢谢!
浏览 1
提问于2018-04-05
得票数 1
回答已采纳
1
回答
scrapy
中的
Lua
脚本
、
、
、
我正在
使用
scrapy
1.6
和
splash
3.2: import
scrapy
from
scrapy
_
splash
import SplashRequest return None 我正在阅读https://blog.scrapinghub.com/2015/03/02/handling-
jav
浏览 11
提问于2019-06-25
得票数 1
回答已采纳
2
回答
飞溅记忆极限(刮擦)
、
我是
从
码头开始的。我为
splash
和
scrapy
创建了一个很大的
lua
脚本
,然后运行,我发现了问题:
Lua
:__gc元方法中的错误(/app/
splash
/
lua
_ much /sandbox.
lua
:189:
脚本
使用
太多内存
浏览 0
提问于2017-06-01
得票数 3
回答已采纳
1
回答
如何
用
scrapy
_
splash
包重定向表单后的帖子?
、
、
、
我
使用
Python、
Scrapy
、
Splash
和
scrapy
_
splash
包来废弃网站。我在SplashRequest中尝试了同样的方法,但是,我无法捕获重定向返回的SSO查询参数。我还尝试
将
lua
<
浏览 3
提问于2017-05-18
得票数 2
回答已采纳
1
回答
使用
Scrapy
和
Lua
在mouseclick上动态加载内容
、
、
、
、
我有一个飞溅刮刀
和
Lua
脚本
。
Lua
脚本
目前只在页面上启动滚动,以便在搜索页上加载更多结果。
从
搜索页面导航到我刮过的详细页面。单击该元素后,
将
加载以下光电旋转木马HTML: <div class="slider-inner"> }
浏览 6
提问于2020-12-20
得票数 0
1
回答
Splash
爬行
Javascript
网站
、
、
我能够
使用
以下代码爬行
Javascript
呈现的页面:from
scrapy
_
splash
import SplashRequest name = 'quotejscrawler' yield SplashRequest
浏览 0
提问于2018-02-16
得票数 0
回答已采纳
3
回答
Python POST请求未返回HTML,请求启用
JavaScript
、
我正在尝试登录我的富国银行帐户,并抓取我的交易历史记录,以便我可以
使用
它们来跟踪我的财务状况。如果我能到达页面的HTML,我就能做抓取部分。{"j_username":"USERNAME", "j_password":"PASSWORD"}print(r.text) })()
浏览 1
提问于2016-01-10
得票数 11
2
回答
Scrapy
:屏幕截图特定元素
、
、
、
、
有没有办法在
splash
中截图一个特定的元素?我似乎找不到解决方案,我找到的唯一选择是
使用
"render.png“,这会截取整个页面的屏幕截图,我只需要一个特定的元素,例如"//table”。我找到了我目前正在
使用
的 (selenium中的解决方案),
Splash
看起来更快,开销更小。 非常感谢。
浏览 3
提问于2018-04-23
得票数 2
1
回答
如果返回一个列表,
如何
从
splash
中检索?
、
、
、
遵循这里的启动源码中提供的示例:在
使用
scrapy
-
splash
时,
如何
使用
lua
脚本
返回
和
检索数组/列表而不是表/字典?
浏览 6
提问于2017-08-02
得票数 0
回答已采纳
2
回答
抓取Android商店
、
、
data-docid'])问题是我只能收集60个包的名称,因为
javascript
我
如何
在Python中重现此行为,以获得超过60个结果?
浏览 4
提问于2018-11-08
得票数 1
2
回答
如何
在
Scrapy
Splash
中
使用
Crawlera
lua
脚本
时获得session_id?
、
、
、
、
如你所知,当我们尝试在Crawlera中
使用
Scrapy
Splash
时,我们
使用
这个
lua
脚本
: -- Make sure you)
splash
:init_cookies(
splash
.args.cookies) assert(
splash
:go{
浏览 7
提问于2018-11-27
得票数 0
2
回答
使用
scrapy
+
splash
返回html
、
、
、
、
我在试着弄清楚刮伤
和
溅
到
的东西。作为练习,我尝试在以下
javascript
网站上点击按钮:,然后返回新呈现页面的html。':{'
lua
_source': script},'endpoint':'execute',}})
splash
_json)', 'type': '
LUA
_ERROR'}
浏览 6
提问于2017-01-12
得票数 2
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
云直播
活动推荐
运营活动
广告
关闭
领券