#HBase

HBase是一个开源的非关系型分布式数据库,它参考了谷歌的BigTable建模,实现的编程语言为Java。

Apache Kylin 入门介绍与学习资源

Yajun_

近日 Kylin v2.6.4 版本发布,包含很多问题修复与各种改进。翻阅三年前写的Kylin测试文档,当时版本还是1.5.3。近两年 Kylin 版本迅速迭代...

1710

0713-6.2.0-HBase的Thrift Server启动问题

Fayson

配置Hue集成HBase的过程中,添加角色实例HBase Thrift Server后,把HBase Thrift身份验证(hbase.thrift.secur...

2530

pinpoint1.8.5安装及使用指南

luozhiyun

pinpoint是开源在github上的一款APM监控工具,它是用Java编写的,用于大规模分布式系统监控。它对性能的影响最小(只增加约3%资源利用率),安装a...

2120

Hbase入门(五)——客户端(Java,Shell,Thrift,Rest,MR,WebUI)

实时计算

Hbase的客户端有原生java客户端,Hbase Shell,Thrift,Rest,Mapreduce,WebUI等等。

2120

一个打车应用早期架构发展史

春哥大魔王

快的打车从2013年年底到2014年下半年,系统访问量迅速膨胀,很多复杂的问题要在短时间内解决,且不能影响线上业务,这是比较大的挑战,看下打车架构演变过程遇到的...

4520

亿级数据从 MySQL 到 Hbase 的三种同步方案与实践

Francis

最近做的数据迁移,当上游数据流向下游过大的时候,HBase就会崩溃。HBase自带的Zookeeper出了问题,就尝试自己安装独立的Zookeeper。

10640

0712-6.2.0-HBase快照异常

Fayson

本文所提出的两个HBase快照恢复的问题,都属于C6的bug。目前,在进行HBase快照操作的时候,请避开文中提出的引起异常的方式:做完快照后,如果是删除表可以...

8720

Hbase入门(四)——表结构设计-RowKey

实时计算

Hbase的表结构设计与关系型数据库有很多不同,主要是Hbase有Rowkey和列族、timestamp这几个全新的概念,如何设计表结构就非常的重要。

7720

Hbase入门(三)——数据模型

实时计算

此表中看起来为空的单元格在 HBase 中不占用空间,或实际上不存在。这就是HBase“稀疏”的原因。表格视图不是查看 HBase 中数据的唯一方法,甚至也不是...

9620

Hbase入门(二)——安装与配置

实时计算

在启动 HBase 之前,您需要设置JAVA_HOME环境变量。您可以通过操作系统的常用设置来设置变量,HBase 也提供了一个中心机制 conf/hbase-...

6920

Hbase入门(一)——初识Hbase

实时计算

本文将介绍大数据的知识和Hbase的基本概念,作为大数据体系中重要的一员,Hbase弥补了Hadoop只能离线批处理的不足,支持存储小文件,随机检索。而这种特性...

9030

HBase2.0新特性详解 顶

个推君

然而,运行HBase老集群(使用HBase1.0版本)多年后,遇到了两大问题:各节点基础环境不一致;该集群的服务器运行多年已过保。而且随着个推业务量增长,性能方...

6410

Phoenix全局索引设计实践

王知无

Phoenix表就是HBase表,而HBase Rowkey都是通过二进制数据的字典序排列存储,也就意味着Row key前缀匹配度越高就越容易排在一起。

7820

HBase TB级数据规模不停机迁移最佳实践

王知无

录入自建集群的HDFS地址、HBase的版本、HBase根目录、HBase连接信息,点击添加会对网络连通性、HBase版本进行校验,源集群和目标集群都验证通过之...

9240

HBase实践 | 数据人看Feed流-架构实践

王知无

起步架构如图9,使用云Kafka+云HBase。如果对Inbox有检索需求,建议使用HBase的scan+filter即可。

11120

图文简述HBase的用途(二)

希望的田野

昨天,我们讲到了HBase的逻辑结构,今天我们来看一下HBase的存储及访问原理。

6210

夏季体验HBase的魅力

希望的田野

因为伪分布式的hbase的依赖于hdfs,因此我将hbase安装好后,首先启动hadoop的hdfs,然后再启动hbase。关闭顺序反之,先关hbase,再关闭...

7330

淘宝大数据之流式计算

希望的田野

1、对于离线、准实时数据都可以在批处理系统中实现(比如MapReduce、MaxCompute),对于此类数据,数据源一般来源于数据库(HBase、Mysql等...

9940

数据倒换工具 Sqoop (大数据时代的ETL)

希望的田野

在传统的数据编程时代,我们今天听到过ETL(数据抽取、转换工具),可以用来从数据源提取数据,经过数据清洗后,放到数据仓库中,如熟知的Logstash, Flum...

7620

Hadoop+Hive+HBase+Spark 集群部署(一)

ByteBye

本文由 bytebye 创作 本站文章除注明转载/出处外,均为本站原创或翻译,转载前请务必署名

9410

扫码关注云+社区

领取腾讯云代金券