PC蜘蛛 - 腾讯云开发者社区

文章/答案/技术大牛

发布

2回答

Websocket一直断开连接(红蜘蛛)

、、

我正在尝试订阅本地网络中的Mac上托管的Websocket。但在连接之后，它几乎立即断开连接。我可以发送消息，我可以在我的Mac上看到它正在接收它们(至少是命令)，但随后它立即断开连接。我在我的Mac上用网大衣在本地试用了它，它看起来像这样：连在一起。可选断开连接(“操作无法完成(Starscream.WSErro

浏览 1提问于2019-08-06得票数 0

回答已采纳

1回答

刮擦数据流、项目和项目装载机

、、、

>>> product = Product(name='Desktop PC', price=1000)Traceback (most recent

浏览 0提问于2018-06-29得票数 1

1回答

如何只获取xml站点地图中的产品页url

、

我使用Scrapy的xml提要蜘蛛站点地图来爬行和提取urls，并且只提取urls。xml站点地图如下所示：<loc></loc> <lastmod>2020catalog/product/cache/de5bc950da2c28fc62848f9a6b789a5c/1/2/1202

浏览 13提问于2022-09-15得票数 1

1回答

我试图在portia的对接版本中运行一个蜘蛛，但是我不想使用像docker exec ... portiacrawl ...这样的终端命令来执行这个蜘蛛。是否可以通过在本地主机端口发出请求并将其保存到特定文件夹来运行已经创建的蜘蛛？portiacrawl： docker exec <CONTAINER_ID> portiacrawl <PROJECT_NAME_PATH> <SPIDER_NAME> -o /some/path/in/my/pc</

浏览 1提问于2019-06-25得票数 0

回答已采纳

1回答

通过局域网将Android应用程序与PC应用程序连接

、、、

我希望这个应用程序响应来自我的PC的命令(最好是运行Windows 8，但可以是Linux:Ubuntu，如果更容易的话)。设备和PC在同一个局域网上，但不通过物理电缆连接。我需要设备在命令发出后0.5秒内对来自PC的命令作出响应。目前的解决方案:创建一个红宝石网站和数据库。当在P

浏览 1提问于2015-10-04得票数 1

1回答

如何使我的刮刮读取同一目录中的文件？

、

url.strip() for url in urls] pass 奇怪的是，重写是没有用的。projectFile =r“d:/

浏览 0提问于2019-03-16得票数 0

回答已采纳

1回答

抓取错蜘蛛

、

在中，OP说 " name :定义此蜘蛛名称的字符串。蜘蛛名称是由Scrapy定位(并实例化)蜘蛛的方式，所以它必须是唯一的。但是，没有什么可以阻止您实例化同一蜘蛛</em

浏览 3提问于2017-03-02得票数 0

回答已采纳

1回答

刮刮需要安装枕头4.0.0或更高版本

我写了一只蜘蛛，然后在我的windows PC上运行它。一切都很顺利。

浏览 21提问于2022-08-06得票数 0

回答已采纳

2回答

我无法从浏览器访问scrapyd端口6800

、、

我可以在没有问题的情况下部署到本地，也可以从浏览器访问localhost:6800，并且可以在本地运行蜘蛛。remoteip:6800/addversion.json我也不能从我的本地PC访问，但我可以在远程PC上从ssh访问(用curl) 我在远程服务器上打开了入站和出站连接，还遗漏了什么？

浏览 5提问于2017-07-15得票数 6

回答已采纳

1回答

Scrapy没有找到Nokogiri找到的Xpath

、、、

以下是这两种情况下使用的代码片段： Product_url，headers={‘User’：‘curl/7.22.0 (x86_64-pc-linux-gnu) libcurl/7.22.0"，“脚本长度: 0，”脚本“：[]}，要求'nokogiri‘要求’OpenSSL‘html_data = open('，’User‘=> 'curl/7.22.0 (x86_64-pc-linux-gnu有人能帮我解释一下吗，请注意这段代码正在运行，我刚刚听说它已经停

浏览 0提问于2016-01-19得票数 0

回答已采纳

1回答

运行蜘蛛:错误:找不到文件：-刮伤

、

 start_urls = [] class Parker_Spider(scrapy.Spider):

浏览 4提问于2016-05-26得票数 5

回答已采纳

2回答

刮取:用管道从数据库中获取Start_Urls

、

好吧，我不想让mysql的东西在蜘蛛里面，在管道里，我遇到了一个问题。如果我试图像前面提到的问题那样将管道对象提交给我的蜘蛛，我只会收到消息中的一个属性错误。有人知道如何把管道对象放在蜘蛛里面吗？

浏览 5提问于2017-09-21得票数 1

回答已采纳

1回答

剪贴的优点是什么？

、

上传)您的项目，并使用JSON web服务控制它们的蜘蛛。在使用上有什么优势吗？

浏览 0提问于2013-04-16得票数 11

回答已采纳

1回答

快速检查刮伤行为/ bug的最简单方法是什么？

、

我有时尝试，但通常不测试我的想法，因为我不知道如何快速做到这一点，而不设置一个完整的Scrapy项目和解析一个真正的网页。

浏览 0提问于2014-12-04得票数 3

回答已采纳

2回答

抓取蜘蛛的管理框架

、

我有一个项目，在其中我已经实施了数以百计的刮除蜘蛛。现在，我遇到了以下问题：我研究过scrapinghub/zyte，但不确定它是否适合我们的目的，因为我们需要

浏览 10提问于2021-02-10得票数 0

2回答

是否有一种方法来创建一个“明星”的情节使用ggplot？

、

注：指的是“星图”，但实际上只讨论蜘蛛情节。pca <-prcomp(df, scale.retx=T)km <- kmeans(df,centers=3)s.class(plot.df, factor(km$cluster))我要寻找的基本特征是“星星”，

浏览 2提问于2013-12-17得票数 8

回答已采纳

1回答

刮取中间件文件结构

、、

print body蜘蛛文件夹中的

浏览 4提问于2015-07-02得票数 1

回答已采纳

1回答

open_spider方法在使用CrawlerProcess时运行两次

、、

我想运行多个蜘蛛，所以我尝试使用CrawlerProcess。但是我发现open_spider方法将在process_item方法的开头和结尾运行两次。这会导致当蜘蛛打开时，我会删除我的集合并将数据保存到mongodb完成。它将再次删除我的收藏。如何解决这个问题，以及为什么open_spider方法运行了两次？

浏览 0提问于2018-02-25得票数 0

回答已采纳

1回答

处理Scrapy分区类

、

Field title = Field() desc = Field()蜘蛛

浏览 2提问于2013-01-24得票数 5

回答已采纳

1回答

用Anaconda运行抓取蜘蛛

、、、

你好，我正在努力完成在以下网站上找到的教程：文件"//anaconda/lib/python2.7/site-packages/scrapy/spiderloader.py"，第43行，在load KeyError(“蜘蛛未找到：{}".format(spider_name)) KeyError：‘

浏览 5提问于2016-10-06得票数 2

回答已采纳

点击加载更多

Websocket一直断开连接(红蜘蛛)

刮擦数据流、项目和项目装载机

如何只获取xml站点地图中的产品页url

我怎么能靠港口运行一只波西亚蜘蛛？

通过局域网将Android应用程序与PC应用程序连接

如何使我的刮刮读取同一目录中的文件？

抓取错蜘蛛

刮刮需要安装枕头4.0.0或更高版本

我无法从浏览器访问scrapyd端口6800

Scrapy没有找到Nokogiri找到的Xpath

运行蜘蛛:错误:找不到文件：-刮伤

刮取:用管道从数据库中获取Start_Urls

剪贴的优点是什么？

快速检查刮伤行为/ bug的最简单方法是什么？

抓取蜘蛛的管理框架

是否有一种方法来创建一个“明星”的情节使用ggplot？

刮取中间件文件结构

open_spider方法在使用CrawlerProcess时运行两次

处理Scrapy分区类

用Anaconda运行抓取蜘蛛

相关资讯

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐