3个大数据处理/数据分析/分布式工具

大数据观察

了解大数据,关注大数据观察吧!

每个想了解最新大数据资讯的人,都关注了我

文 / 数据君

导读:Hadoop是一个开源框架,它允许在整个集群使用简单编程模型计算机的分布式环境存储并处理大数据。

它的目的是从单一的服务器到上千台机器的扩展,每一个台机都可以提供本地计算和存储。

1.Hadoop

Hadoop是一个开源框架,它允许在整个集群使用简单编程模型计算机的分布式环境存储并处理大数据。它的目的是从单一的服务器到上千台机器的扩展,每一个台机都可以提供本地计算和存储。

2.Druid

Druid是实时数据分析存储系统,Java语言中最好的数据库连接池。Druid能够提供强大的监控和扩展功能。

Druid是一个分布式的、面向列的、实时的分析数据存储库,通常用于为多租户环境中的探索性仪表板供电。

Druid作为一种数据仓库解决方案,擅长于对petabyte大小的数据集进行快速聚合查询。Druid支持各种灵活的过滤器、精确计算、近似算法和其他有用的计算。

Druid可以同时加载流数据和批处理数据,并与Samza、Kafka、Storm、SPark和Hadoop集成。

3.Ambari

大数据平台搭建、监控利器;类似的还有CDH

Ambari能够:

• 提供Hadoop集群

• Ambari为在任意数量的主机上安装Hadoop服务提供了一个逐步向导。

• Ambari处理集群Hadoop服务的配置。

• 管理Hadoop集群

• Ambari为整个集群提供启动、停止和重新配置Hadoop服务的中央管理。

• 监视Hadoop集群

• Ambari为监视Hadoop集群的健康状况和状态提供了一个仪表板。

• 安巴里杠杆Ambari度量系统用于度量集合。

• 安巴里杠杆Ambari警报框架用于系统警报,并在需要注意时通知您(例如,节点下降,剩余磁盘空间较低等)。

主题 |工具软件

插图 | 网络来源

作 者 介 绍

数据君:)

了解大数据,关注大数据观察

部分图文来自网络,侵权则删

我想给你一个理由 继续面对这操蛋的生活

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180828B0Z6NC00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注腾讯云开发者

领取腾讯云代金券