hbase 源码解析_hbase源码_hbase 源码 - 腾讯云开发者社区

您找到你想要的搜索结果了吗？

是的

没有找到

千万级数据查询：CK、ES、RediSearch怎么选？

点击上方“芋道源码”，选择“设为星标” 管她前浪，还是后浪？能浪的浪，才是好浪！每天 10:33 更新文章，每天掉亿点点头发... 源码精品专栏原创 | Java 2021 超神之路，很肝~ 中文详细注释的开源项目 RPC 框架 Dubbo 源码解析网络应用框架 Netty 源码解析消息中间件 RocketMQ 源码解析数据库中间件 Sharding-JDBC 和 MyCAT 源码解析作业调度中间件 Elastic-Job 源码解析分布式事务中间件 TCC-Transaction

Spark常用函数（源码阅读六）

源码层面整理下我们常用的操作RDD数据处理与分析的函数，从而能更好的应用于工作中。

Hbase 的 WAL 在 RegionServer 基本调用过程

Elasticsearch 亿级数据检索性能优化案例实战

HBase client 客户端重试机制

在hbase集群故障时，hbase client无法连接region server的时候，因为重试参数配置问题，程序并不会直接抛出异常，而是会一直重试，导致异常报警没有触发。此篇文章讲述client的重试机制及参数配置。

慕课网Spark SQL日志分析 - 3.Spark SQL概述

Spark SQL不仅仅有访问或者操作SQL的功能，他还提供了其他的非常丰富的操作：外部数据源，优化

hive安装部署

1、准备环境 1，软件准备 Java-- jdk-8u121-linux-x64.tar.gz Hadoop--hadoop-2.7.4.tar.gz (jdk1.7会报错) Hive-- apa

玩转HBase百亿级数据扫描

出于中通业务场景的特殊性，我们需要大量的回刷7-15天的数据，如果全部用离线抽取的方式，会给业务系统带来巨大压力，所以利用Hbaserowkey更新的特性，来存储业务数据的历史更新，每天ETL的任务需要大量从Hbase拉取数据，ETL任务需要扫描过滤近百亿数据。

出行领域架构设计

作者：王小雪。滴滴出行架构师，原快的打车架构师。来源：程序员杂志某知名打车平台从随着业务的发展，系统访问量迅速膨胀，很多复杂的问题要在短时间内解决，且不能影响线上业务，这是比较大的挑战，本文将会阐

一个打车应用早期架构发展史

快的打车从2013年年底到2014年下半年，系统访问量迅速膨胀，很多复杂的问题要在短时间内解决，且不能影响线上业务，这是比较大的挑战，看下打车架构演变过程遇到的一些有代表性的问题和解决方案。

快的打车架构实践

1.客户端与服务端通信会遇到哪些问题？ 2.怎样基于Storm和HBase打造实时监控平台？ 3.怎样对Web系统进行分布式改造？快的打车从2013年年底到2014年下半年，系统访问量迅速膨胀，很多

HBase二次开发之搭建HBase调试环境，如何远程debug HBase源代码

之前的文章也提到过，最近工作中需要对HBase进行二次开发（参照HBase的AES加密方法，为HBase增加SMS4数据加密类型）。研究了两天，终于将开发流程想清楚并搭建好了debug环境，所以就迫不及待地想写篇文章分享给大家。

大数据学习之路（持续更新中...）

在16年8月份至今，一直在努力学习大数据大数据相关的技术，很想了解众多老司机的学习历程。因为大数据涉及的技术很广需要了解的东西也很多，会让很多新手望而却步。所以，我就在自己学习的过程中总结一下学到的内容以及踩到的一些坑，希望得到老司机的指点和新手的借鉴。前言在学习大数据之前，先要了解他解决了什么问题，能给我们带来什么价值。一方面，以前IT行业发展没有那么快，系统的应用也不完善，数据库足够支撑业务系统。但是随着行业的发展，系统运行的时间越来越长，搜集到的数据也越来越多，传统的数据库已经不能支撑全量数

大数据技术之_27_电商平台数据分析项目_01_大数据的框架回顾 + 大数据的企业应用

Hadoop job 提交简图或 YARN 架构或 YARN 工作机制或 job 提交流程 0、job 提交简图

spring boot 实践学习案例大全

https://gitee.com/itcode-itcode/springboot-learning-example.git

Apache HBase内核深度剖析

前面一篇文章介绍了Kafka的具体内容，今天讲述一下HBase相关的知识。首先HBase作为大数据发展初期伴随Google三大论文问世的一个组件，在今天依旧被广泛的应用，今天我们来仔细的分析一下HBase的内部原理，了解一下HBase的具体内幕，以便在工作中更好使用它。以下内容涉及到的源码基于HBase 的Master分支编译出的最新的3.0.0版本。

图解图库JanusGraph系列-janusgraph图数据库的本地源码编译教程（janusgraph source code compile）

源码分析的第一步就是要先编译好源代码，才能进行debug跟踪流程查看，本文总结了janusgraph源码编译的全流程！

源码图库-一文搞定janusgraph图数据库的本地源码编译（source code compile）

源码分析的第一步就是要先编译好源代码，才能进行debug跟踪流程查看，本文总结了janusgraph源码编译的全流程！

SSTable详解

几年前在读Google的BigTable论文的时候，当时并没有理解论文里面表达的思想，因而囫囵吞枣，并没有注意到SSTable的概念。再后来开始关注HBase的设计和源码后，开始对BigTable传递的思想慢慢的清晰起来，但是因为事情太多，没有安排出时间重读BigTable的论文。在项目里，我因为自己在学HBase，开始主推HBase，而另一个同事则因为对Cassandra比较感冒，因而他主要关注Cassandra的设计，不过我们两个人偶尔都会讨论一下技术、设计的各种观点和心得，然后他偶然的说了一句：Cassandra和HBase都采用SSTable格式存储，然后我本能的问了一句：什么是SSTable？他并没有回答，可能也不是那么几句能说清楚的，或者他自己也没有尝试的去问过自己这个问题。然而这个问题本身却一直困扰着我，因而趁着现在有一些时间深入学习HBase和Cassandra相关设计的时候先把这个问题弄清楚了。

Hadoop基础教程-第13章源码编译（13.3 HBase1.2.6源码编译）

010

数据治理（六）：编译Atlas安装包

Atlas官网没有提供Atlas的安装包，需要下载Atlas的源码后编译安装，下载Atlas源码需要登录Atlas官网下载Atlas：https://atlas.apache.org/#/Downloads,选择2.1.0版本：

如何使用HBase快照实现跨集群全量与增量数据迁移

我们常常会碰到需要迁移HBase数据的场景，当一个HBase集群运行较长时间后，往往数据量都会很大，HBase集群往往支撑的都是线上的业务，不像跑批的Hive/Spark集群，不能随便停机。HBase默认提供import/export方法支持备份和还原，而且支持增量，但是因为是使用HBase的API导出和还原数据，对RegionServer的压力会很大，往往会影响旧集群的在线业务。

Hbase 写入 hdfs 源码分析

Kylin在用户行为轨迹分析中的应用实践与优化

2015年12月8日，Apache Kylin 从 Apache 孵化器项目毕业，正式升级为顶级项目，也是第一个由中国团队完整贡献到 Apache 的顶级项目。kylin的诞生，为大数据高效的olap查询提供解决方案，主要由以下特点：

基于canal的client-adapter数据同步必读指南

本文将介绍canal项目中client-adapter的使用，以及落地生产中需要考虑的可靠性、高可用与监控报警。（基于canal 1.1.4版本）

Hbase WAL 线程模型源码分析

本文介绍了HBase的WAL（Write Ahead Log）机制，包括其线程模型、多生产者单消费者模型以及日志落盘策略。HBase通过WAL机制将随机写转化为顺序写，提高了读写性能和可靠性。同时，WAL机制也保证了HBase的容错能力，即当发生故障时，可以从最近的备份中恢复数据。

014

存储系统又慢又杂太难用？我们推荐这几本书帮你解决问题

我们常用的存储系统种类非常多，有单机的也有分布式的，有的是数据库，有的是文件系统，还有介于二者之间的。无论是哪种存储系统（比如，MySQL、Redis、Elasticsearch，等等），它们都具有如下三个特点。

spark读写HBase之使用hortonworks的开源框架shc（一）：源码编译以及测试工程创建

以下是我修改后的两个子模块core和examples中的pom文件，只修改了version

Apache Kylin 入门介绍与学习资源

近日 Kylin v2.6.4 版本发布，包含很多问题修复与各种改进。翻阅三年前写的Kylin测试文档，当时版本还是1.5.3。近两年 Kylin 版本迅速迭代，社区不断发展，已经成为 Hadoop 生态中不可或缺的 OLAP 引擎。

HBase应用实践专场-HBase问题排查思路

如果重度依赖HBase，有必要对HBase源码进行深入理解,建议根据日志去找追踪源码！！！

个推基于Flink SQL建设实时数仓实践

作为一家数据智能企业，个推在服务垂直行业客户的过程中，会涉及到很多数据实时计算和分析的场景，比如在服务开发者时，需要对App消息推送的下发数、到达数、打开率等后效数据进行实时统计；在服务政府单位时，需要对区域内实时人口进行统计和画像分析。为了更好地支撑大数据业务发展，个推也建设了自己的实时数仓。相比Storm、Spark等实时处理框架，Flink不仅具有高吞吐、低延迟等特性，同时还支持精确一次语义（exactly once）、状态存储等特性，拥有很好的容错机制，且使用门槛低、易上手、开发难度小。因此，个推主要基于Flink SQL来解决大部分的实时作业需求。

HBase运维实践－聊聊RIT的那点事

相信长时间运维HBase集群的童鞋肯定都会对RIT（Region-In-Transition，很多参考资料误解为Region-In-Transaction，需要注意）有一种咬牙切齿的痛恨感，一旦Region处于长时间的RIT就会有些不知所措，至少以前的我就是这样过来的。正所谓“恐惧来源于未知”，不知所措意味着我们对RIT知之甚少，然而“凡事都有因果，万事皆有源头”，处于RIT状态的Region只是肉眼看到的一个结果，为什么会处于RIT状态才是问题探索的根本，也是解决问题的关键。本文就基于hbase 0.98.9版本对RIT的工作机制以及实现原理进行普及性的介绍，同时在此基础上通过真实案例讲解如何正确合理地处理处于RIT状态的Region。一方面希望大家能够更好的了解RIT机制，另一方面希望通过本文的学习之后可以不再’惧怕’RIT，正确认识处于RIT状态的Region。

大数据学习过程中需要看些什么书？学习路线

很多朋友对大数据行业心向往之，却苦于不知道该如何下手。作为一个零基础大数据入门学习者该看哪些书？今天给大家推荐一位知乎网友挖矿老司机的指导贴，作为参考。

0864-7.1.6-如何跨CDP集群通过HBase快照迁移数据

该文档主要通过使用HBase快照导出历史全量数据并还原到新的HBase集群，然后改造源生的ExportSnapshot类，通过比较变化的文件实现导出增量，并最终实现HBase跨集群的增量备份和还原。

2021年大数据Spark（二十）：Spark Core外部数据源引入

Spark可以从外部存储系统读取数据，比如RDBMs表中或者HBase表中读写数据，这也是企业中常常使用，如：

Java连接HBase的正确方法及Connection创建步骤与详解

HBASE的连接不像其他传统关系型数据库连接需要维护连接池。HBASE连接若使用错误则会导致随时间推移程序创建的TCP连接过多，导致HBASE连接失败。

Apache Kylin VS Apache Doris全方位对比

本文作者：康凯森，来源于：https://blog.bcmeng.com，文章写的非常详细，从各个方面对Kylin和Doris进行了对比。

Apache Kylin VS Apache Doris

本文作者：康凯森，来源于：https://blog.bcmeng.com，文章写的非常详细，从各个方面对Kylin和Doris进行了对比。

大数据技术之_18_大数据离线平台_05_离线平台项目模块小结

1、将项目软件工具包导入 2、项目思路： 2.1、读取 HDFS 数据进行 ETL 清洗操作，并将最终结果写入到 HBase 中。 2.2、从 HBase 中读取数据，进行新增用户统计分析操作，并将结果写入到 Mysql。 3、细节实现数据清洗： 3.1、LoggerUtil.java 3.1.1、主要作用：将字符串数据解析成 HashMap 键值对集合。 3.1.2、重要细节：字符串的截取不合法数据的过滤字符串的解码（就是将%相关的字符串编码转换成可读类型的数据）错误数据的 Logger

HBase Region 自动拆分策略

其中BusyRegionSplitPolicy是HBase-2.x新增的策略，其他6种在HBase-1.2.x中也可以使用。

HBase 读流程解析与优化的最佳实践

本文首先对 HBase 做简单的介绍，包括其整体架构、依赖组件、核心服务类的相关解析。再重点介绍 HBase 读取数据的流程分析，并根据此流程介绍如何在客户端以及服务端优化性能，同时结合有赞线上 HBase 集群的实际应用情况，将理论和实践结合，希望能给读者带来启发。如文章有纰漏请在下面留言，我们共同探讨共同学习。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐