小奎因的 PYTHON 项目部署与调度直播分享来了

阅读本文大概需要 10 分钟。

“凉风有性 秋月无边……” 编不下去了。

自从上次发布开源库 aiowebsocket 之后,小奎因已经很久没有在公众号露面了。

其是这段时间我在憋大招,一是我正在编写一本反爬虫原理和对应绕过技巧方面的书籍;二是我和崔哥在重构 Gerapy 项目;对,没错。就是这个 star 数 1200+ 的 爬虫部署和调度平台 Gerapy。

在重构 Gerapy 项目的过程中,踩了不少的坑,但也学习到了很多知识。大家都知道,爬虫项目在编写完成后往往需要部署到服务器上,以便定时执行。重构 Gerapy 的过程中,需要解决以下问题:

  • 从部署到执行的过程会经历哪些阶段?
  • 如何将 PYHTON 项目打包成 EGG 文件?
  • 版本控制是如何实现的?
  • 如何运行 EGG 文件?
  • 任何 PYTHON 项目都可以放到服务器上调度吗?
  • 定时任务功能是如何实现的?
  • 同时运行多个 EGG 文件的原理是什么?

现在很多团队都在构建企业内部使用的爬虫一体化平台,如果你掌握了这些知识,就能够为团队提出很多建议。当然,作为一名合格的爬虫工程师,我们也有必要了解项目完整的生命周期。

我花了一段时间整理 Gerapy 项目重构过程中获得的经验,恰逢华为云社区举办云享专家直播活动,我有幸争取到了一个直播的机会。我将会在 2019 年 5 月 22 日晚 19:00 在华为云社区开启主题为《45 分钟掌握 PYTHON 项目部署与调度核心逻辑》的直播。直播内容主要涉及 PYTHON 项目打包、EGG 包运行、项目版本控制、多机通信、并行执行和定时任务等。

大家可以从本次直播中收获进程交互进程协议分布式多机通信任意 PYTHO项目打包EGG 文件的运行等知识。同时能够掌握 PYTHON 项目从打包到部署再到执行的整个流程的关键技术点

你将在直播中看到这样的代码:

还有这样的代码:

和这样的代码:

本次直播还准备了一些 PYTHON 爬虫类书籍作为观众提问的奖品。 比如:

欢迎大家传播分享

小奎因将继续为大家贡献知识。

原文发布于微信公众号 - 进击的Coder(FightingCoder)

原文发表时间:2019-05-22

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

扫码关注云+社区

领取腾讯云代金券