腾讯云

文章/答案/技术大牛

发布

社区首页 >问答首页 >托管一个节点网络爬虫？

问托管一个节点网络爬虫？
EN

Stack Overflow用户

提问于 2020-09-21 19:44:41

回答 1查看 42关注 0票数 0

我有一个爬虫，它每隔60秒检查一次用Nodejs编写的URL列表。它不使用数据库，在内存中存储一些项目，并且应该全天候运行。

托管这个爬虫的合适的解决方案是什么？

据我所知，AWS是按秒付费的，我想这会让一个全天候的过程变得非常昂贵？也许我在这里遗漏了一些东西，AWS文档非常令人困惑。

node.js

hosting

回答 1

Stack Overflow用户

发布于 2020-09-21 20:21:30

这个工具听起来足够轻便(基于目的)，所以我选择了一个无服务器解决方案来减少操作占用空间:所以使用Lambda函数或ECS FarGate。以下是你期望支付的费用：

对于Lambda，假设512MB运行5秒@每100ms 0.0000008333次: 60次调用* 24小时* 30天-> _43200 * 0.0000008333_50* ~= $1.8每月

https://s3.amazonaws.com/lambda-tools/pricing-calculator.html

对于占用空间最小的Fargate :0.25vCPU和0.5 30内存：((0.25 * 0.01239249) + (0.5 * 0.00136079)) * 24 *30 ~= 每月2.7美元

对这些数字要小心，只是一个快速的草稿。这两种方法都相当便宜，但Lambda可能更容易使用，而且您还表示不需要内存中的项来持久化调用。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/63999011

复制

盘点一个Python网络爬虫问题

python href 函数网络爬虫源码

前几天在Python钻石交流群【空】问了一个Python网络爬虫处理的问题，一起来看看吧。他的代码如下：

前端皮皮

2023/10/17

1720

如何编写一个简易网络爬虫

爬虫

感谢小臣投稿本文将简述网络爬虫及其工作流程，结合个人实践，简单介绍如何使用HttpClient、HtmlParser第三方jar工具包，编写一个简易的网络爬虫。网络爬虫简述及流程架构网络爬虫，又叫网页蜘蛛，是一种按照一定的规则逻辑，自动地抓取网络信息的程序或者脚本。在当今网络时代，信息量爆炸性增长，不同领域、不同背景的用户对信息的获取有不同的需求。人们无法在这么海量信息中及时有效地获取到极具针对性的信息。搜索引擎一定程度上也无法根据语义查询，满足用户定制化需求。诸如此

java达人

2018/01/31

1.4K0

盘点一个Python网络爬虫问题

python 编程测试数据网络爬虫

前几天在Python最强王者群【刘桓鸣】问了一个Python网络爬虫的问题，这里拿出来给大家分享下。

Python进阶者

2023/08/31

2160

网络爬虫

php 网站爬虫搜索引擎数据库

四火

2022/07/15

6590

盘点一个Python网络爬虫的问题

python 网站表格数据网络爬虫

前几天在Python白银群【大侠】问了一个Python网络爬虫的问题，这里拿出来给大家分享下。

前端皮皮

2023/08/17

1820

分享一个playwright网络爬虫实战教程

php python json 爬虫

前几天在Python交流白银群【空翼】问了一道Python网络爬虫的问题，如下图所示。

前端皮皮

2022/08/17

1.9K0

python 网络爬虫入门（一）———第一个python爬虫实例

python html 文件存储爬虫

最近两天学习了一下python，并自己写了一个网络爬虫的例子。 python版本: 3.5 IDE : pycharm 5.0.4 要用到的包可以用pycharm下载： File->Default Settings->Default Project->Project Interpreter 选择python版本并点右边的加号安装想要的包

全栈程序员站长

2022/08/31

2.4K0

盘点一个Python网络爬虫实战问题

python 爬虫

前几天在Python铂金交流群【红色基因代代传】问了一个Python网络爬虫的问题，提问截图如下：

Python进阶者

2022/11/14

1730

精通 Python 网络爬虫：网络爬虫学习路线

大数据

本文主要介绍了如何精通Python网络爬虫，从选择编程语言、掌握基础语法、常用爬虫库、数据提取与去重、反爬处理、分布式爬虫、项目实战等方面进行了详细的阐述。同时，文章还推荐了几本与Python网络爬虫相关的书籍，以帮助读者更好地学习和掌握相关知识。

韦玮

2017/08/08

3.5K0

盘点一个网络爬虫中常见的一个错误

python php 爬虫

前几天在Python白银交流群有个叫【雨就是雨】的粉丝问了一个Python网络爬虫的问题，这里拿出来给大家分享下，一起学习下。

Python进阶者

2022/06/05

2200

网络爬虫原理

爬虫安全 php http https

网络爬虫指按照一定的规则（模拟人工登录网页的方式），自动抓取网络上的程序。简单的说，就是讲你上网所看到页面上的内容获取下来，并进行存储。网络爬虫的爬行策略分为深度优先和广度优先。如下图是深度优先的一种遍历方式是A到B到D 到E 到C到 F（ABDECF）而宽度优先的遍历方式ABCDEF 。

全栈程序员站长

2022/07/22

7890

网络爬虫（一）

爬虫编程算法 http html

爬虫是按照一定规则，自动地提取并保存网页中信息的程序。通过向网站发起请求获取资源，提取其中有用的信息。爬虫在获取信息、整理数据等方面应用广泛。

陆勤_数据人网

2020/11/26

6400

Python——网络爬虫

爬虫 python scrapy

此篇文章继续跟着小甲鱼的视频来初学网络爬虫，除了小甲鱼的网站上可下载视频，发现b站上也有全套的视频哦，会比下载来的更方便些。网络爬虫，又称为网页蜘蛛（WebSpider），非常形象的一个名字。如果你

闪电gogogo

2018/01/08

1.5K0

数据采集技术python网络爬虫_精通Python网络爬虫

apache php javascript tcp/ip

网络爬虫（Crawler）又称网络蜘蛛，或者网络机器人（Robots）. 它是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。换句话来说，它可以根据网页的链接地址自动获取网页内容。如果把互联网比做一个大蜘蛛网，它里面有许许多多的网页，网络蜘蛛可以获取所有网页的内容。爬虫是一个模拟人类请求网站行为, 并批量下载网站资源的一种程序或自动化脚本。

全栈程序员站长

2022/09/27

1.8K0

点进来，这里告诉你：爬虫学习之一个简单的网络爬虫

爬虫数据分析

###概述这是一个网络爬虫学习的技术分享，主要通过一些实际的案例对爬虫的原理进行分析，达到对爬虫有个基本的认识，并且能够根据自己的需要爬到想要的数据。有了数据后可以做数据分析或者通过其他方式重新结构化展示。 ###什么是网络爬虫网络爬虫（又被称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者），是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。via 百度百科网络爬虫网络蜘蛛（Web spider）也叫网络爬虫（We

小莹莹

2018/04/23

8580

Python网络爬虫实战项目大全，最后一个亮了

爬虫 python mongodb 云数据库 Redis®

wcspider [1]- 微信公众号爬虫。使用爬虫搜索所有微信公众号资料及其文章，通过搜狗搜索获取公众号的openid，创建公众号历史消息请求URL，解析出历史消息总量、历史消息总页数、单个历史消息

Python中文社区

2018/01/31

1.8K0

创建一个分布式网络爬虫的故事

其他

编者按：作者通过创建和扩展自己的分布式爬虫，介绍了一系列工具和架构, 包括分布式体系结构、扩展、爬虫礼仪、安全、调试工具、Python 中的多任务处理等。以下为译文：大概600万条记录，每个记录有15个左右的字段。这是我的数据分析项目要处理的数据集，但它的记录有一个很大的问题：许多字段缺失，很多字段要么格式不一致或者过时了。换句话说，我的数据集非常脏。但对于我这个业余数据科学家来说还是有点希望的-至少对于缺失和过时的字段来说。大多数记录包含至少一个到外部网站的超链接，在那里我可能找到我需要的信息。因此

CSDN技术头条

2018/02/06

1.2K0

盘点Python网络爬虫入门常见的一个问题

python 网络安全爬虫

前几天在Python铂金交流群【余丰恺】问了一个Python网络爬虫的问题，如下图所示。

前端皮皮

2022/08/17

3050

学习了《python网络爬虫实战》第一个爬虫，爬取新浪新闻

python 爬虫 anaconda 人工智能

请安装anaconda,其中附带的spyder方便运行完查看变量 1.进入cmd控制台，输入 pip install BeautifulSoup4 pip install requests 2.编写代码，代码已经很清晰了，直接运行不会报错并有成功的结果

潇洒坤

2018/09/10

1K0

快速入门网络爬虫系列 Chapter01 | 初识网络爬虫

数据分析爬虫搜索引擎 api php

我们为什么要了解网络爬虫？因为当今从事科学研究等，需要大量的数据，但是这些数据公开的又非常的少，大量的数据都在大公司的手中。我们这些普通人本身并没有那么多数据，但是我们又需要大量的数据。那么，这时我们就需要用到网络爬虫了。

不温卜火

2020/10/28

8760

相似问题

用节点爬虫或简单爬虫进行NodeJS网络爬行

网络爬虫-如何删除div中的子节点？

简易网络爬虫

自动网络爬虫

识别网络爬虫

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

问托管一个节点网络爬虫？
EN