腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
本地
运行
Apify
时
如何
设置
cookie
?
经过大量的Googling搜索,我不知道
如何
使用原始cookies (即name1=value1; name2=value2; ...)为傀儡
Apify
爬虫
设置
cookies。我看到有Page.SetCookie,但这需要一个Puppeteer.
Cookie
对象数组。每次都很难格式化。 我还看到
Apify
支持
在
Apify
仪表板上
设置
cookie
。但是如果我想在
本地
运行
我的应用程序,这是没有帮助的(至
浏览 16
提问于2020-08-27
得票数 0
1
回答
如果
设置
了
APIFY
_DEFAULT_DATASET_ID,则找不到默认数据集
Apify
documentation 解释说,默认数据集可以通过
设置
环境变量
APIFY
_DEFAULT_DATASET_ID来命名。如果我这样做,
在
创建puppeteer crawler之前使用代码示例1(见下文),如果我爬行页面并使用代码示例2存储结果,我会得到一个。//代码示例1:
设置
默认数据集id常量爬虫=新的
浏览 23
提问于2019-10-20
得票数 0
1
回答
将
cookie
从Actor传递给Crawler
我用我想要抓取的URL
设置
了一个爬虫,演员正在工作,我用
cookie
/截图示例进行了测试。我只是在演员和爬虫之间传递
cookie
时
遇到了问题: const
Apify
= require('
apify
'); const input= await
Apify
.getValue('INPUT'); const browser = a
浏览 26
提问于2019-05-10
得票数 0
2
回答
如何
阻止
Apify
保存已处理的请求?
、
、
看起来
Apify
将处理过的请求保存在“已处理”目录中。我想停止这个操作,因为
apify
不会抓取我之前抓取过的页面。有人知道
如何
阻止
Apify
保存已处理的请求吗?
浏览 25
提问于2020-10-21
得票数 0
回答已采纳
1
回答
如何
在傀儡中使用会话
cookie
进行身份验证
、
我想要存储我的会话
cookie
,并使用木偶师.验证我的帐户。 现在,我直接使用我的用户名和密码进行身份验证。
浏览 2
提问于2020-03-18
得票数 2
1
回答
如何
在
Apify
SDK多次
运行
中共享
cookie
、
、
、
抓取搜索结果的每一页
Apify
.main(async () => { // what should this code好的,如果不是,我只是想知道我是否遗漏了一种明显的方法,可以
在
同一爬虫的不同
运行
中或者
在
不同的爬虫实例之间共享会话状态。FWIW,我只爬了20页,所以perf没什么
浏览 16
提问于2022-01-02
得票数 0
1
回答
如何
在
Apify
crawls之后重命名输出文件?
、
、
、
我已经搜索了
Apify
文档,但我找不到一种方法来
设置
输出文件名。现在它是{.json}索引,但是我可以为
Apify
抓取的每个页面指定一个自定义名称吗?
浏览 16
提问于2020-04-17
得票数 0
回答已采纳
1
回答
应用从sitemap.xml中抓取urls
、
Apify
可以从sitemap.xml抓取链接 const requestList= new
Apify
.RequestList({ sources: [{ requestsFromUrl: 'https://edition.cnn.com/sitemaps/cnn/news.xml
浏览 0
提问于2019-08-20
得票数 3
回答已采纳
1
回答
找不到木偶剧相关模块和依赖项
、
、
、
、
我使用npm安装了puppeteer,然后
在
尝试编译它
时
,出现了以下错误:我尝试了这里的解决方案: "puppeteer": "^1.14.0", }我认为在其中添加jest没
浏览 1
提问于2019-04-04
得票数 1
1
回答
在
Apify
云中不获取“输入”
我已经将项目加载到
Apify
云中,当我使用输入
运行
它
时
,问题非常有趣:No found!。不过,它在我的电脑上
运行
得很顺利。
运行
日志:2019-08-20T13:17:58.013Z ACTOR: StartingnodeVersion":"v10.16.0"}2019-08-20
浏览 1
提问于2019-08-20
得票数 0
回答已采纳
1
回答
SyntaxError:等待仅在带有
Apify
元形态的异步函数中有效
我正试图用一个非常简单的例子来获取
Apify
的:const request = require('request-promise');
Apify
.main(async () => { startUrls: [{url: "http://example.org"}],const title = await pag
浏览 0
提问于2019-07-26
得票数 0
回答已采纳
1
回答
如何
查找
apify
任务
运行
的完成状态
如何
查看
apify
任务
运行
的完成状态(成功、失败、中止)?, }); "taskId": ${JSON.stringify(process.env.
APIFY
_ACTOR_TASK_ID || null)}, "runId
浏览 10
提问于2020-01-03
得票数 0
回答已采纳
1
回答
在生成的参与者配置中的应用错误
、
我正在尝试
在
本地
运行
Apify
,
在
安装了所有软件包之后,创建了参与者并
运行
了它,我得到了以下内容: > test2@0
浏览 6
提问于2022-02-08
得票数 0
1
回答
应用码头
如何
运行
、
、
、
使用Node/
Apify
/Puppeteer,我
如何
将我的应用程序封装起来并在
本地
测试
运行
?这是我的装置。node-fetch": "^3.2.6", }, "start": "node main.js"} 我能跑到
本地
去nor
APIFY
_TOK
浏览 1
提问于2022-07-18
得票数 1
回答已采纳
1
回答
本地
开发/调试
时
的httpOnly
cookie
、
、
、
、
我
在
web-test.domain.com上
运行
web,
在
services-test.domain.com上
运行
服务。 为了调试,我
在
本地
运行
了一些web服务。但问题是,当我
在
本地
运行
auth服务(其中
设置
了
cookie
)但services-test.domain.com上的其他服务
运行
时,
cookie
(带有sessionID)不会随请求一起
浏览 2
提问于2015-03-02
得票数 6
1
回答
Apify
-将JSON输出保存到key-store-value
、
、
如何
将此脚本的JSON输出保存到
Apify
中的key-store-value?当我
运行
脚本
时
,一切正常,数据集显示了每种类型的抓取数据,但是key-value-store/Keys仍然是空的。下面是我的Actor代码: const
Apify
= require('
apify
'); const metamorphInput"debugLog":
浏览 6
提问于2020-09-11
得票数 0
1
回答
关于代理轮换的几个问题
如果代理旋转是活动的,我
如何
看到它工作,例如,当代理旋转触发
时
,在哪里可以获得已使用的IP?如果创建了新的爬虫,或者打开了新的选项卡,那么在哪里可以获得已使用的IP? 最佳毕业生,Wulfg ng
浏览 1
提问于2019-10-29
得票数 0
3
回答
最好的办法是在做完之后再刮一次。
、
、
最后,当所有30个url都被刮掉
时
,我需要点击最后一个单独的URL,将30个URL抓取的结果放到一个消防站db中,并进行一些其他的突变(比如查找地址等)。目前,我有一个请求队列中的所有30个urls (通过
Apify
web-接口),并且我试图查看它们何时全部完成。 let pendingRequestCount = await queue.getInfo(); 我需要将最后一个
浏览 2
提问于2019-08-13
得票数 2
回答已采纳
1
回答
使用
Apify
抓取多个页面
、
可以使用带有伪URL的
Apify
抓取多个页面吗? 当人们问同样的问题
时
,答案大多指向伪URL,如果有可能或不可能这样做,并不会直接解决问题。如果我在
运行
爬虫的时候不知道伪URL,并且我从一个页面上抓取了10个链接-然后想要抓取这10个链接,那怎么做呢?https://kb.
apify
.com/tutorial-creating-your-first-crawler/crawling-multiple-pages
浏览 15
提问于2019-03-19
得票数 0
1
回答
无法
设置
-
Cookie
、
、
、
环境Linux : 18.01 LTS我
在
控制器中使用了当前的方法:public ResponseEntityloginCredentials) { .header(HttpHeaders.SET_
COOKIE
("*") .allowedMethods("*"
浏览 0
提问于2019-03-12
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何在Windows上使用GUI在本地运行稳定地扩散
在制作微信投票时如何设置投票规则?
如何将 Zendesk 的 Help Center 迁移到 Baklib?
crsf与xss详细讲解
前端本地存储讲解,这真的很全面!
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券