首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

开源日志系统比较:scribe、chukwa、kafka、flume

本文从设计架构,负载均衡,可扩展性和容错性等方面对比了当今开源的日志系统, 包括facebook的scribe,apachechukwa,linkedin的kafka和cloudera的flume等。...ApacheChukwa chukwa是一个非常新的开源项目,由于其属于hadoop系列产品,因而使用了很多hadoop的组件(用HDFS存储,用mapreduce处理数据),它提供了很多模块以支持hadoop...架构: Chukwa中主要有3种角色,分别为:adaptor,agent,collector。...(2) HDFS 存储系统 Chukwa采用了HDFS作为存储系统。HDFS的设计初衷是支持大文件存储和小并发高速写的应用场景,而日志系统的特点恰好相反,它需支持高并发低速率的写和大量小文件的存储。...参考资料 scribe主页:https://github.com/facebook/scribe chukwa主页:http://incubator.apache.org/chukwa/ kafka主页

1.7K120
您找到你想要的搜索结果了吗?
是的
没有找到

【推荐收藏】六大主流大数据采集平台架构分析

今天为大家介绍几款数据采集平台:Apache Flume Fluentd Logstash Chukwa Scribe Splunk Forwarder。...1、Apache Flume 官网:https://flume.apache.org/ Flume 是Apache旗下的一款开源、高可靠、高扩展、容易管理、支持客户扩展的数据采集系统。...4、Chukwa 官网:https://chukwa.apache.org/ Apache Chukwaapache旗下另一个开源的数据收集平台,它远没有其他几个有名。...Chukwa基于Hadoop的HDFS和Map Reduce来构建(显而易见,它用Java来实现),提供扩展性和可靠性。Chukwa同时提供对数据的展示,分析和监视。...Chukwa的部署架构如下: ? Chukwa的主要单元有:Agent,Collector,DataSink,ArchiveBuilder,Demux等等,看上去相当复杂。

1.3K20

Java程序员,你一定需要了解的六款大数据采集平台

今天为大家介绍几款数据采集平台: Apache Flume Fluentd Logstash Chukwa Scribe Splunk Forwarder 大数据平台与数据采集...1、Apache Flume 官网:https://flume.apache.org/ Flume 是Apache旗下的一款开源、高可靠、高扩展、容易管理、支持客户扩展的数据采集系统。...4、Chukwa 官网:https://chukwa.apache.org/ Apache Chukwaapache旗下另一个开源的数据收集平台,它远没有其他几个有名。...Chukwa基于Hadoop的HDFS和Map Reduce来构建(显而易见,它用Java来实现),提供扩展性和可靠性。Chukwa同时提供对数据的展示,分析和监视。...Chukwa的部署架构如下: Chukwa的主要单元有:Agent,Collector,DataSink,ArchiveBuilder,Demux等等,看上去相当复杂。

1.2K10

大数据采集工具,除了Flume,还有什么工具?

今天为大家介绍几款数据采集平台: Apache Flume Fluentd Logstash Chukwa Scribe Splunk Forwarder 大数据平台与数据采集 任何完整的大数据平台,一般包括以下的几个过程...1、Apache Flume 官网:https://flume.apache.org/ Flume 是Apache旗下的一款开源、高可靠、高扩展、容易管理、支持客户扩展的数据采集系统。...4、Chukwa 官网:https://chukwa.apache.org/ Apache Chukwaapache旗下另一个开源的数据收集平台,它远没有其他几个有名。...Chukwa基于Hadoop的HDFS和Map Reduce来构建(显而易见,它用Java来实现),提供扩展性和可靠性。Chukwa同时提供对数据的展示,分析和监视。...Chukwa的部署架构如下: Chukwa的主要单元有:Agent,Collector,DataSink,ArchiveBuilder,Demux等等,看上去相当复杂。

1.9K20

果断收藏!六大主流大数据采集平台架构分析

今天为大家介绍几款数据采集平台: Apache Flume Fluentd Logstash Chukwa Scribe Splunk Forwarder 大数据平台与数据采集 任何完整的大数据平台,一般包括以下的几个过程...1、Apache Flume 官网:https://flume.apache.org/ Flume 是Apache旗下的一款开源、高可靠、高扩展、容易管理、支持客户扩展的数据采集系统。...4、Chukwa 官网:https://chukwa.apache.org/ Apache Chukwaapache旗下另一个开源的数据收集平台,它远没有其他几个有名。...Chukwa基于Hadoop的HDFS和Map Reduce来构建(显而易见,它用Java来实现),提供扩展性和可靠性。Chukwa同时提供对数据的展示,分析和监视。...Chukwa的部署架构如下: ? Chukwa的主要单元有:Agent,Collector,DataSink,ArchiveBuilder,Demux等等,看上去相当复杂。

90040

你一定需要 六款大数据采集平台的架构分析

今天为大家介绍几款数据采集平台: Apache Flume Fluentd Logstash Chukwa Scribe Splunk Forwarder 大数据平台与数据采集 任何完整的大数据平台,一般包括以下的几个过程...1、Apache Flume 官网:https://flume.apache.org/ Flume 是Apache旗下的一款开源、高可靠、高扩展、容易管理、支持客户扩展的数据采集系统。...4、Chukwa 官网:https://chukwa.apache.org/ Apache Chukwaapache旗下另一个开源的数据收集平台,它远没有其他几个有名。...Chukwa基于Hadoop的HDFS和Map Reduce来构建(显而易见,它用Java来实现),提供扩展性和可靠性。Chukwa同时提供对数据的展示,分析和监视。...Chukwa的部署架构如下: Chukwa的主要单元有:Agent,Collector,DataSink,ArchiveBuilder,Demux等等,看上去相当复杂。

1.8K30

你一定需要了解的六款大数据采集平台

今天为大家介绍几款数据采集平台: Apache Flume Fluentd Logstash Chukwa Scribe Splunk Forwarder 大数据平台与数据采集 任何完整的大数据平台,一般包括以下的几个过程...1、Apache Flume 官网:https://flume.apache.org/ Flume 是Apache旗下的一款开源、高可靠、高扩展、容易管理、支持客户扩展的数据采集系统。...4、Chukwa 官网:https://chukwa.apache.org/ Apache Chukwaapache旗下另一个开源的数据收集平台,它远没有其他几个有名。...Chukwa基于Hadoop的HDFS和Map Reduce来构建(显而易见,它用Java来实现),提供扩展性和可靠性。Chukwa同时提供对数据的展示,分析和监视。...Chukwa的部署架构如下: ? Chukwa的主要单元有:Agent,Collector,DataSink,ArchiveBuilder,Demux等等,看上去相当复杂。

5.9K50

Java程序员,你一定需要了解的六款大数据采集平台

今天为大家介绍几款数据采集平台: Apache Flume Fluentd Logstash Chukwa Scribe Splunk Forwarder 大数据平台与数据采集 任何完整的大数据平台,一般包括以下的几个过程...1、Apache Flume 官网:https://flume.apache.org/ Flume 是Apache旗下的一款开源、高可靠、高扩展、容易管理、支持客户扩展的数据采集系统。...4、Chukwa 官网:https://chukwa.apache.org/ Apache Chukwaapache旗下另一个开源的数据收集平台,它远没有其他几个有名。...Chukwa基于Hadoop的HDFS和Map Reduce来构建(显而易见,它用Java来实现),提供扩展性和可靠性。Chukwa同时提供对数据的展示,分析和监视。...Chukwa的部署架构如下: ? Chukwa的主要单元有:Agent,Collector,DataSink,ArchiveBuilder,Demux等等,看上去相当复杂。

66220

Java开发者一定要了解的六款大数据采集平台

今天为大家介绍几款数据采集平台: Apache Flume Fluentd Logstash Chukwa Scribe Splunk Forwarder 大数据平台与数据采集 任何完整的大数据平台,一般包括以下的几个过程...Flume 官网:https://flume.apache.org/ Flume 是Apache旗下的一款开源、高可靠、高扩展、容易管理、支持客户扩展的数据采集系统。...4、Chukwa 官网:https://chukwa.apache.org/ Apache Chukwaapache旗下另一个开源的数据收集平台,它远没有其他几个有名。...Chukwa基于Hadoop的HDFS和Map Reduce来构建(显而易见,它用Java来实现),提供扩展性和可靠性。Chukwa同时提供对数据的展示,分析和监视。...Chukwa的部署架构如下: Chukwa的主要单元有:Agent,Collector,DataSink,ArchiveBuilder,Demux等等,看上去相当复杂。

2.6K10

果断收藏!六大主流大数据采集平台架构分析

今天为大家介绍几款数据采集平台: Apache Flume Fluentd Logstash Chukwa Scribe Splunk Forwarder 大数据平台与数据采集 任何完整的大数据平台,一般包括以下的几个过程...1、Apache Flume 官网:https://flume.apache.org/ Flume 是Apache旗下的一款开源、高可靠、高扩展、容易管理、支持客户扩展的数据采集系统。...4、Chukwa 官网:https://chukwa.apache.org/ Apache Chukwaapache旗下另一个开源的数据收集平台,它远没有其他几个有名。...Chukwa基于Hadoop的HDFS和Map Reduce来构建(显而易见,它用Java来实现),提供扩展性和可靠性。Chukwa同时提供对数据的展示,分析和监视。...Chukwa的部署架构如下: Chukwa的主要单元有:Agent,Collector,DataSink,ArchiveBuilder,Demux等等,看上去相当复杂。

6.9K81

【推荐收藏】六大主流大数据采集平台架构分析

今天为大家介绍几款数据采集平台:Apache Flume Fluentd Logstash Chukwa Scribe Splunk Forwarder。...1、Apache Flume 官网:https://flume.apache.org/ Flume 是Apache旗下的一款开源、高可靠、高扩展、容易管理、支持客户扩展的数据采集系统。...4、Chukwa 官网:https://chukwa.apache.org/ Apache Chukwaapache旗下另一个开源的数据收集平台,它远没有其他几个有名。...Chukwa基于Hadoop的HDFS和Map Reduce来构建(显而易见,它用Java来实现),提供扩展性和可靠性。Chukwa同时提供对数据的展示,分析和监视。...Chukwa的部署架构如下: ? Chukwa的主要单元有:Agent,Collector,DataSink,ArchiveBuilder,Demux等等,看上去相当复杂。

1.4K40

【工具】你一定需要 六款大数据采集平台的架构分析

今天为大家介绍几款数据采集平台: Apache Flume Fluentd Logstash Chukwa Scribe Splunk Forwarder 大数据平台与数据采集 任何完整的大数据平台,一般包括以下的几个过程...1、Apache Flume 官网:https://flume.apache.org/ Flume 是Apache旗下的一款开源、高可靠、高扩展、容易管理、支持客户扩展的数据采集系统。...4、Chukwa 官网:https://chukwa.apache.org/ Apache Chukwaapache旗下另一个开源的数据收集平台,它远没有其他几个有名。...Chukwa基于Hadoop的HDFS和Map Reduce来构建(显而易见,它用Java来实现),提供扩展性和可靠性。Chukwa同时提供对数据的展示,分析和监视。...Chukwa的部署架构如下: ? Chukwa的主要单元有:Agent,Collector,DataSink,ArchiveBuilder,Demux等等,看上去相当复杂。

2.1K80

六大主流大数据采集平台架构分析

今天为大家介绍几款数据采集平台: Apache Flume Fluentd Logstash Chukwa Scribe Splunk Forwarder 大数据平台与数据采集 任何完整的大数据平台,一般包括以下的几个过程...1、Apache Flume 官网:https://flume.apache.org/ Flume 是Apache旗下的一款开源、高可靠、高扩展、容易管理、支持客户扩展的数据采集系统。...4、Chukwa 官网:https://chukwa.apache.org/ Apache Chukwaapache旗下另一个开源的数据收集平台,它远没有其他几个有名。...Chukwa基于Hadoop的HDFS和Map Reduce来构建(显而易见,它用Java来实现),提供扩展性和可靠性。Chukwa同时提供对数据的展示,分析和监视。...Chukwa的部署架构如下: Chukwa的主要单元有:Agent,Collector,DataSink,ArchiveBuilder,Demux等等,看上去相当复杂。

3.8K20

你的每一次点击行为,是如何变成数据的?| 聊一聊互联网公司的内部数据采集

(当然我说的是内部的数据采集,外部的数据爬取、购买的第三方数据,不在本文讨论范围之内) 各大互联网巨头都开发了自己的日志采集系统,如 Apachechukwa,Facebook 的 Scribe,...这里主要介绍一下 chukwa 和 Scribe,尽量用简单的语言来让大家明白其架构思想: 1、chukwa chukwaApache 的开源项目,作为 Hadoop 系列产品之一,使用了很多 Hadoop...chukwa包括了一系列组件,用于监控数据,分析数据和数据可视化等。...实际上,chukwa 的效率并不高,因为它并不是单纯的日志收集工具,而是包含了数据的分析处理、可视化等功能的完整数据框架。但是,数据收集和数据分析俩大任务在优化目标上并不相同甚至一定程度上是相悖的。...很多人认为,这样还不如只专一的做数据收集,把数据分析等交给其他成熟的框架来实现,也因此chukwa并没有被广泛的使用。 2、scribe Scribe 是 Facebook 的开源日志收集系统。

1.6K70

吐血整理:常用的大数据采集工具,你不可不知

尤其近几年随着Flume的不断完善,用户在开发过程中使用的便利性得到很大的改善,Flume现已成为Apache Top项目之一。...input { file { type =>"Apache-access" path =>"/var/log/Apache2/other_vhosts_access.log...4 Chukwa ChukwaApache旗下另一个开源的数据收集平台,它远没有其他几个有名。...Chukwa基于Hadoop的HDFS和MapReduce来构建(用Java来实现),提供扩展性和可靠性。它提供了很多模块以支持Hadoop集群日志分析。Chukwa同时提供对数据的展示、分析和监视。...Chukwa适应以下需求: (1)灵活的、动态可控的数据源。 (2)高性能、高可扩展的存储系统。 (3)合适的架构,用于对收集到的大规模数据进行分析。 Chukwa架构如图4所示。

1.8K10

大数据开发的工具有哪些?

加米谷大数据为大家介绍下大数据开发工具 Hadoop Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。...Hadoop 以一种可靠、高效、可伸缩的方式进行数据处理 Ambari Apache Ambari是一种基于Web的工具,支持Apache Hadoop集群的供应、管理和监控。...Chukwa ? chukwa 是一个开源的用于监控大型分布式系统的数据收集系统。...Chukwa 还包含了一个强大和灵活的工具集,可用于展示、监控和分析已收集的数据 ? ? ?...此外,通过使用 Apache Hadoop 库,Mahout 可以有效地扩展到云中 ? MapReduce MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。

88540
领券