首页
学习
活动
专区
圈层
工具
发布

爬虫架构|利用Kafka处理数据推送问题(3)架构图

一、需求

1、对于所有任务产生的实时数据,通过Kafka及时推送。 2、对于新加任务需要去历史全量数据表中获取该任务已有的历史数据。 3、爬虫集群在生产数据时需要去全量数据中进行下匹配,如果不存在才会推送给Kafka。

二、架构设计图

Kafka+MySQL架构设计

三、结语

欢迎相关人员一起交流。

举报
领券