python爬虫部署_腾讯云服务器部署python爬虫_云服务器下部署python爬虫 - 腾讯云开发者社区

python、git、github、scrapy

我用Python2.7编写了大量的Scrapy爬行器。我需要将它们全部转换为支持Python 3，这种转换必须在1 go内完成。我只能在Python 3爬虫做好部署准备之后才能开始使用。我不能一次部署一个爬虫。我目前有一个远程分支，它是主分支。让我们称之为遥控器-A。这就是容纳所有爬行器的分支，它们每天都会被执行。这个分支必须继续运作。现在，由于“所有操作都必须保持活动状态”，我需要一个单独的Python 3

浏览 3提问于2019-09-10得票数 0

回答已采纳

1回答

定期运行python程序作为防火墙中的后台服务。

python、reactjs、firebase

我已经有了负责解析数据的python爬虫，但是我不知道如何(在后台)在firebase中执行服务器的这个python爬虫(或者根本不可能)？下面是我的系统的示例用法用户可以从数据库中看到网站变更的摘要。我想到的一个选择是在本地机器上运行爬虫，并使用REST将解析的数据更新到firebase数据库。然而，这似乎是一种非常低效/天真的方法，因为它有点失去了使用云服务(如

浏览 0提问于2018-01-25得票数 3

3回答

用于调试phantomjs脚本的GUI

phantomjs

我正在使用phantomjs来构建一个网络爬虫。我目前使用的爬虫是一个使用selenium的Python脚本，它需要一个正在运行的Firefox浏览器。虽然Selenium非常适合于调试脚本(因为我可以使用firebug来检查网页)，但是如果没有GUI，它就不能部署到linux服务器上。因此，我正在尝试将我的Python脚本转换为phantomjs。为了调试phantomjs脚本，我将页面源代码html保存到磁盘并呈现png屏幕截图，然后在Firefox中打开它以检查源页面。

浏览 1提问于2013-07-31得票数 6

1回答

Scrapy部署已停止工作

python、scrapy、scrapyd

我正在尝试使用scrapyd部署scrapy项目，但它给了我错误...Building egg of eScraper-13714637506800/addversion.jsonTraceback (most recent call last): File "/usr/local/lib/python2.7txweb.py", line 10, in ren

浏览 1提问于2013-06-17得票数 1

回答已采纳

1回答

问题: java.lang.IllegalArgumentException:与阴影元素ElementDescription对应的真实屏幕元素

android、google-play

我在Google Play上有一个应用程序。在我的上一次构建中，Google向我展示了这个问题： java.lang.IllegalArgumentException:真实屏幕元素对应于阴影元素ElementDescription{className=android.support.v7.widget.AppCompatTextView, resourceName=com.myappp.testapp:id/lab_separator, contentDescription=, componentType=TEXT_VIEW, inputType=NONE, isWebViewElement

浏览 0提问于2018-08-28得票数 13

回答已采纳

1回答

有没有什么方法可以让我问比特币的全部节点，他们最近的同龄人的IP地址？

tcp、blockchain、p2p、bitcoin

我读到比特币网络拓扑是秘密的，但我能问一下他们过去有哪些连接吗？

浏览 0提问于2019-04-26得票数 0

1回答

爬行，爬行，获取数据

network-scan

我想写一个爬虫来做一些基础设施(路由器，WAPS，系统等)的清单。所以，我在服务器上安装了一个应用程序，以及如何部署它。爬虫是怎么开始的？爬虫是如何返回数据的？

浏览 5提问于2008-12-05得票数 0

1回答

python、amazon-web-services、cron、crontab、amazon-elastic-beanstalk

我在一个弹力豆茎应用程序上有一个抓取器，我可以像这样运行SSH：我想帮我安排一个任务来处理这个问题。我的runcrawler.sh文件

浏览 0提问于2015-04-13得票数 0

1回答

如何将与Luigi数据管道集成？

python、http、web-crawler、data-processing、luigi

我目前正在构建一个Python后端，该后端将部署到一个AWS EC2实例中，该实例具有以下体系结构：网络爬虫数据-保存到S3* =\任何建议，文件，或文章将是超级感谢！

浏览 1提问于2017-06-13得票数 3

回答已采纳

1回答

如何在您自己的ami中管理应用程序？

amazon-ec2

我们有一些从互联网上收集数据的爬虫。对于我们的应用程序来说，EC2 spot是一个非常便宜的解决方案。在我们的例子中，我们可以通过以下步骤来设置爬虫： 3.2删除

浏览 2提问于2012-07-09得票数 0

回答已采纳

1回答

Docker服务需要影响另一个服务的两个副本

docker、docker-compose、scrapy

首先是免责声明，我大约6、7个月前才开始学习Python，在此之前我没有任何开发经验。我的第一个项目是一个使用Scrapy引擎的web抓取项目。在学习了Docker之后，我决定把它分解成容器。最后，我有部署服务，这是给我带来麻烦的地方。deploy服务等待Scrapyd服务完全启动(通过脚本中的APi调用进行验证)，然后为所有我的爬虫(抓取数据的网络爬虫)构建python蛋文件，并通过post请求将它们发送给Scrapyd。，除了部署服务似乎只影响Scrapyd的一个副本。然后我就这么做

浏览 24提问于2020-03-14得票数 1

回答已采纳

1回答

读取行时出现Scrapyd部署错误: EOFError: EOF

python、ubuntu、scrapy、web-crawler、scrapyd

我有两台pc，PC A没有错误，爬虫程序部署成功，但在PC B上，错误发生了。我的Scrapyd服务器正在运行，但是当我试图部署我的爬虫程序时，出现了这些错误。{"status": "error", "message":Traceback (most recent call last):\\n File \"/usr/lib/python2.7/runpy.py/runpy.py\&

浏览 0提问于2017-11-09得票数 0

1回答

如何创建包含驱动程序的python* selenium应用程序？*

python、selenium

我刚刚开始学习python和爬行。我使用selenium和漂亮的汤来解析和爬行pages.My的问题是，如果我必须制作一个应用程序，或将其部署在某个iis服务器上(或任何其他我不知道的方式，比如它是如何工作的)，我甚至不确定它是否像我从移动应用程序方法中所说的那样工作那么，是否必须在服务器上安装chrome才能让爬虫运行?？如何将二进制文件与应用程序一起发布？同样，我使用的是linux，因此部署此应用程序的服务器必须是linux ?？或者我如何实现it.Can ?有人可以帮助我创建这个爬虫的应用程序并将其

浏览 2提问于2019-12-11得票数 3

1回答

如何同时从地形创建多个胶水爬行器

amazon-web-services、terraform、aws-glue、terraform-provider-aws

我正在部署来自terraform的爬虫数组，我希望同时部署一个包含2个或更多爬虫的列表。我使用的是foreach，但是对于dynamodb_target，我无法找到如何将它与特定的爬虫相关联，也就是说，爬虫1具有table_name 1作为dynamodb_target an等等。

浏览 11提问于2022-10-12得票数 0

回答已采纳

3回答

“属性错误: NoneType对象没有属性'module_name'”

python、scrapy、egg、scrapyd

我试图使用scrapy将我的爬虫项目部署到一个scrapyd实例中，但是调用这个推荐返回以下错误： from setuptools import setup, find_packages我知道python在访问应该是对象的属性时会抛出这样

浏览 2提问于2013-01-31得票数 2

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何轻松地在远程github分支和本地分支/文件夹之间切换？

定期运行python程序作为防火墙中的后台服务。

用于调试phantomjs脚本的GUI

Scrapy部署已停止工作

问题: java.lang.IllegalArgumentException:与阴影元素ElementDescription对应的真实屏幕元素

有没有什么方法可以让我问比特币的全部节点，他们最近的同龄人的IP地址？

爬行，爬行，获取数据

怎样在不使用远程桌面的情况下就能查看储存在腾讯云服务器上面的文件（不是网盘）？

只爬行一次URL的刮伤蜘蛛

如何在Heroku云上部署Scrapy spider

为网络爬虫存储URL边界和分发工作？

文档龙中的Algolia DocSearch没有带来任何结果

弹性豆杆不运行的克隆约伯

如何将与Luigi数据管道集成？

如何在您自己的ami中管理应用程序？

Docker服务需要影响另一个服务的两个副本

读取行时出现Scrapyd部署错误: EOFError: EOF

如何创建包含驱动程序的python* selenium应用程序？*

如何同时从地形创建多个胶水爬行器

“属性错误: NoneType对象没有属性'module_name'”

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐