海量日志数据存储用 elasticsearch 和 hbase 哪个?

首先看两者的简单介绍:

ElasticSearch:是一个基于Lucene的搜索引擎;

HBase:是一个开源的,非关系的,分布式的数据模型存储引擎;

两个框架都可以做分布式的存储和搜索,但是在海量日志数据面前,具体应该选择哪个框架呢?

以下几点可以考虑:

  1. 查询复杂度:HBase支持比较简单的行或者区间查询,如果更复杂的查询功能就不太容易支持。ES支持的查询比较丰富。
  2. 数据量:两者都是支持海量数据的。由于HBase天生的大数据身份,本能的支撑更大量级的数据;ES最开始只是一个基于Lucene的搜索引擎,后期加入了存储的扩展,也就是说ES在存储扩展上可能会非一些力气。
  3. 维护成本:一旦项目上线,维护成本也是一个必须考虑的问题,HBase基于的是Hadoop那一套,组建多,代价高;ES独立扩展维护较简单一些。

简单一句话:考虑存储的场景使用HBase;考虑查询的场景使用ES;当然两者结合更完美。

原文发布于微信公众号 - 服务端技术杂谈(ITIBB2014)

原文发表时间:2017-04-22

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏顾宇的研习笔记

避免持续集成服务器成为一个安全隐患

最近临时接手了一个客户测试环境和产品环境的维护工作。接手的客户资产里包含:代码库,生产环境主机,测试环境主机以及搭建在测试环境主机上的CI(基于Jenkins)...

14440

API-First,Kubernetes上微服务的一种方法

对那些曾经使用更传统方式构建应用的开发者来说,转向容器化微服务不是一个容易的转变。当开发者设计分布式应用时,微服务应用也正是分布式的,其中有许多新的概念和细节需...

49040
来自专栏Ribbon

Spring Cloud 系列-Ribbon

负载均衡(Load Balance): 建立在现有网络结构之上,它提供了一种廉价有效透明的方法扩展网络设备和服务器的带宽、增加吞吐量、加强网络数据处理能力、提高...

3210
来自专栏服务端技术杂谈

系统的高可用(纯理论)

专注服务端首先要专注的是关于高可用。 有的时候高可用系统并不是简单的技术方案,会包含很多其他的东西。 什么是高可用? 基本来讲是为了让我们的计算机(硬件/软件...

35460
来自专栏服务端技术杂谈

20分钟了解微服务

image.png 简介 所有的功能打包在一个war包里,基本没有外部依赖(除了容器),部署在一个JEE容器(Tomcat,JBoss,WebLogic)里,...

28530
来自专栏lulianqi

为什么需要多线程

对于这个问题可能很多朋友会说是为了高性能,个人觉得这是误解,多线程不等于高性能,从cpu(单核)的角度上看单线程才能带来最高性能。

19220
来自专栏架构师之路

58怎么玩数据库架构(upyun架构与运维大会速记)

大家好,我是58沈剑,今天我分享的主题是《58怎么玩数据库架构》,我的PPT页数非常少,讨论的问题非常的聚焦。 一、数据库的基本概念 基本概念就一页PPT,让大...

43790
来自专栏alexqdjay

SpringCloud(一)Eureka2.0

37550
来自专栏IT大咖说

微软:云原生的MySQL托管服务架构及读写分离的优化

内容来源:2017 年 08 月 24 日,微软中国首席产品经理宋青见在“ODF 2017开源数据库论坛(北京)”进行《云原生的MySQL托管服务架构及读写分离...

14630
来自专栏蛋未明的专栏

nodejs学习指南

25060

扫码关注云+社区

领取腾讯云代金券