----
主要使用场景
Kafka 通常在数据管道中有两种主要使用场景:
Kafka 作为数据管道的一个端点,起源端或目的端。...例如,从 Kafka 导出数据到 S3,或者从 MongoDB 导入数据到 Kafka。
Kafka 作为数据管道中两个端点之间的中间件。...----
主要价值
Kafka 为数据管道带来的主要价值在于:
它可以作为一个大型的缓冲区,有效地解耦数据生产者和消费者。
它在安全性和效率方面非常可靠,是构建数据管道的最佳选择。...耦合性和灵活性:
避免针对每个应用创建单独的数据管道,增加维护成本。
保留元数据和允许schema变更,避免生产者和消费者紧密耦合。
尽量少处理数据,留给下游系统更大灵活性。...总之,构建一个好的数据管道,需要考虑到时间、安全、格式转换、故障处理等方方面面,同时还需要尽量 loosely coupled,给使用数据的下游系统最大灵活性。