腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
Websocket一直断开连接(红
蜘蛛
)
、
、
我正在尝试订阅本地网络中的Mac上托管的Websocket。但在连接之后,它几乎立即断开连接。我可以发送消息,我可以在我的Mac上看到它正在接收它们(至少是命令),但随后它立即断开连接。我在我的Mac上用网大衣在本地试用了它,它看起来像这样:连在一起。 可选断开连接(“操作无法完成(Starscream.WSErro
浏览 1
提问于2019-08-06
得票数 0
回答已采纳
1
回答
刮擦数据流、项目和项目装载机
、
、
、
>>> product = Product(name='Desktop
PC
', price=1000)Traceback (most recent
浏览 0
提问于2018-06-29
得票数 1
1
回答
如何只获取xml站点地图中的产品页url
、
我使用Scrapy的xml提要
蜘蛛
站点地图来爬行和提取urls,并且只提取urls。xml站点地图如下所示:<loc></loc> <lastmod>2020catalog/product/cache/de5bc950da2c28fc62848f9a6b789a5c/1/2/1202
浏览 13
提问于2022-09-15
得票数 1
1
回答
我怎么能靠港口运行一只波西亚
蜘蛛
?
、
、
、
我试图在portia的对接版本中运行一个
蜘蛛
,但是我不想使用像docker exec ... portiacrawl ...这样的终端命令来执行这个
蜘蛛
。是否可以通过在本地主机端口发出请求并将其保存到特定文件夹来运行已经创建的
蜘蛛
?portiacrawl: docker exec <CONTAINER_ID> portiacrawl <PROJECT_NAME_PATH> <SPIDER_NAME> -o /some/path/in/my/
pc</
浏览 1
提问于2019-06-25
得票数 0
回答已采纳
1
回答
通过局域网将Android应用程序与
PC
应用程序连接
、
、
、
我希望这个应用程序响应来自我的
PC
的命令(最好是运行Windows 8,但可以是Linux:Ubuntu,如果更容易的话)。设备和
PC
在同一个局域网上,但不通过物理电缆连接。我需要设备在命令发出后0.5秒内对来自
PC
的命令作出响应。目前的解决方案:创建一个红宝石网站和数据库。当在
P
浏览 1
提问于2015-10-04
得票数 1
1
回答
如何使我的刮刮读取同一目录中的文件?
、
url.strip() for url in urls] pass 奇怪的是,重写是没有用的。projectFile =r“d:/
浏览 0
提问于2019-03-16
得票数 0
回答已采纳
1
回答
抓取错
蜘蛛
、
在中,OP说 " name :定义此
蜘蛛
名称的字符串。
蜘蛛
名称是由Scrapy定位(并实例化)
蜘蛛
的方式,所以它必须是唯一的。但是,没有什么可以阻止您实例化同一
蜘蛛</em
浏览 3
提问于2017-03-02
得票数 0
回答已采纳
1
回答
刮刮需要安装枕头4.0.0或更高版本
我写了一只
蜘蛛
,然后在我的windows
PC
上运行它。一切都很顺利。
浏览 21
提问于2022-08-06
得票数 0
回答已采纳
2
回答
我无法从浏览器访问scrapyd端口6800
、
、
我可以在没有问题的情况下部署到本地,也可以从浏览器访问localhost:6800,并且可以在本地运行
蜘蛛
。remoteip:6800/addversion.json我也不能从我的本地
PC
访问,但我可以在远程
PC
上从ssh访问(用curl) 我在远程服务器上打开了入站和出站连接,还遗漏了什么?
浏览 5
提问于2017-07-15
得票数 6
回答已采纳
1
回答
Scrapy没有找到Nokogiri找到的Xpath
、
、
、
以下是这两种情况下使用的代码片段: Product_url,headers={‘User’:‘curl/7.22.0 (x86_64-
pc
-linux-gnu) libcurl/7.22.0",“脚本长度: 0,”脚本“:[]}, 要求'nokogiri‘要求’OpenSSL‘html_data = open(',’User‘=> 'curl/7.22.0 (x86_64-
pc
-linux-gnu有人能帮我解释一下吗,请注意这段代码正在运行,我刚刚听说它已经停
浏览 0
提问于2016-01-19
得票数 0
回答已采纳
1
回答
运行
蜘蛛
:错误:找不到文件:-刮伤
、
start_urls = [] class Parker_Spider(scrapy.Spider):
浏览 4
提问于2016-05-26
得票数 5
回答已采纳
2
回答
刮取:用管道从数据库中获取Start_Urls
、
好吧,我不想让mysql的东西在
蜘蛛
里面,在管道里,我遇到了一个问题。如果我试图像前面提到的问题那样将管道对象提交给我的
蜘蛛
,我只会收到消息中的一个属性错误。有人知道如何把管道对象放在
蜘蛛
里面吗?
浏览 5
提问于2017-09-21
得票数 1
回答已采纳
1
回答
剪贴的优点是什么?
、
上传)您的项目,并使用JSON web服务控制它们的
蜘蛛
。 在使用上有什么优势吗?
浏览 0
提问于2013-04-16
得票数 11
回答已采纳
1
回答
快速检查刮伤行为/ bug的最简单方法是什么?
、
我有时尝试,但通常不测试我的想法,因为我不知道如何快速做到这一点,而不设置一个完整的Scrapy项目和解析一个真正的网页。
浏览 0
提问于2014-12-04
得票数 3
回答已采纳
2
回答
抓取
蜘蛛
的管理框架
、
我有一个项目,在其中我已经实施了数以百计的刮除
蜘蛛
。现在,我遇到了以下问题: 我研究过scrapinghub/zyte,但不确定它是否适合我们的目的,因为我们需要
浏览 10
提问于2021-02-10
得票数 0
2
回答
是否有一种方法来创建一个“明星”的情节使用ggplot?
、
注:指的是“星图”,但实际上只讨论
蜘蛛
情节。pca <-prcomp(df, scale.retx=T)km <- kmeans(df,centers=3)s.class(plot.df, factor(km$cluster))我要寻找的基本特征是“星星”,
浏览 2
提问于2013-12-17
得票数 8
回答已采纳
1
回答
刮取中间件文件结构
、
、
print body
蜘蛛
文件夹中的
浏览 4
提问于2015-07-02
得票数 1
回答已采纳
1
回答
open_spider方法在使用CrawlerProcess时运行两次
、
、
我想运行多个
蜘蛛
,所以我尝试使用CrawlerProcess。但是我发现open_spider方法将在process_item方法的开头和结尾运行两次。这会导致当
蜘蛛
打开时,我会删除我的集合并将数据保存到mongodb完成。它将再次删除我的收藏。 如何解决这个问题,以及为什么open_spider方法运行了两次?
浏览 0
提问于2018-02-25
得票数 0
回答已采纳
1
回答
处理Scrapy分区类
、
Field title = Field() desc = Field()
蜘蛛
浏览 2
提问于2013-01-24
得票数 5
回答已采纳
1
回答
用Anaconda运行抓取
蜘蛛
、
、
、
你好,我正在努力完成在以下网站上找到的教程: 文件"//anaconda/lib/python2.7/site-packages/scrapy/spiderloader.py",第43行,在load KeyError(“
蜘蛛
未找到:{}".format(spider_name)) KeyError:‘
浏览 5
提问于2016-10-06
得票数 2
回答已采纳
点击加载更多
相关
资讯
漫威蜘蛛侠2PC1月31日上线!PSN账号如何注册绑定?
SEO蜘蛛池——如何搭建蜘蛛池
网站怎样吸引到baidu蜘蛛#蜘蛛池sEo
网络蜘蛛基本工作流程•爬虫工作原理#蜘蛛池SEO
八爪鱼SEO强引蜘蛛是什么#蜘蛛池sEO
热门
标签
更多标签
云服务器
ICP备案
云直播
腾讯会议
对象存储
活动推荐
运营活动
广告
关闭
领券