开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

查询Bigtable以扫描Bigquery中的rowkey

Bigtable是一种高性能、可扩展的分布式面向列的NoSQL数据库，由Google开发。它被设计用于处理海量数据，并提供了快速的读写能力。Bigtable的数据模型类似于一个稀疏的、分层的、分布式的多维映射表，其中每个单元格由行键（row key）、列族（column family）、列限定符（column qualifier）和时间戳（timestamp）唯一标识。

Bigquery是Google Cloud提供的一种全托管的、高度可扩展的企业级数据仓库解决方案。它支持大规模数据分析和查询，并具有快速的查询性能和强大的扩展能力。Bigquery使用SQL语言进行查询，并提供了高级的分析功能，如聚合、窗口函数等。

要查询Bigtable以扫描Bigquery中的rowkey，可以使用以下步骤：

首先，确保已经创建了Bigtable表和Bigquery数据集，并将数据导入到Bigtable和Bigquery中。
在Bigtable中，使用适当的API或客户端库连接到Bigtable实例。
使用适当的查询语言（如HBase API或其他支持的语言）编写查询，以扫描Bigtable中的特定rowkey。查询可以根据需要指定列族、列限定符和时间戳等条件。
执行查询并获取结果。根据具体需求，可以将结果返回给应用程序进行进一步处理或分析。
在Bigquery中，使用适当的API或客户端库连接到Bigquery数据集。
在Bigquery中执行查询，以获取与Bigtable中扫描的rowkey相关的数据。查询可以使用SQL语言编写，并可以根据需要指定筛选条件、聚合函数等。
获取查询结果，并根据需要进行进一步处理或分析。

在腾讯云中，类似的产品和服务可以是：

Bigtable替代方案：腾讯云的分布式数据库TDSQL，它提供了高性能、可扩展的分布式数据库解决方案，适用于海量数据存储和查询场景。产品介绍链接：TDSQL
Bigquery替代方案：腾讯云的数据仓库CDW，它是一种全托管的、高度可扩展的企业级数据仓库解决方案，支持大规模数据分析和查询。产品介绍链接：CDW

请注意，以上提到的腾讯云产品仅作为示例，实际选择应根据具体需求和场景进行评估。

相关搜索:Dataproc spark作业无法扫描bigtable中的记录 BigQuery中的查询缓存如何在BigQuery中以类似通配符的方式查询多个结构生成select查询以扫描用户指定的列 bigquery中的循环遍历查询限制Go中Bigtable查询返回的单元格数量在BigQuery中列出计划的查询 Google-Bigquery:查询扫描整个表，而不是分区表中的给定范围查询以获取Google BigQuery中每个id的两个示例记录。sql select查询中扫描的行数按条件查询BigQuery中的数组列从BigQuery UDF中的参数查询表统计SQL查询/ bigquery中的值数如何从BigQuery中的查询中检索numRows、resultSize BigQuery -查询列中的each和set元素为bigquery中的嵌套结构构建查询如何比较我在BigQuery中的查询性能？我的BigQuery查询中的条件语句被忽略将多个标量bigquery查询组合到一个查询中以生成一个表 BigQuery:运行查询以创建表并在表存在的情况下追加到表中

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

谷歌推出 Bigtable 联邦查询，实现零 ETL 数据分析

作者 | Steef-Jan Wiggers 译者 | 明知山策划 | 丁晓昀最近，谷歌宣布 Bigtable 联邦查询普遍可用，用户通过 BigQuery 可以更快地查询 Bigtable 中的数据。此外，查询无需移动或复制所有谷歌云区域中的数据，增加了联邦查询并发性限制，从而缩小了运营数据和分析数据之间长期存在的差距。 BigQuery 是谷歌云的无服务器、多云数据仓库，通过将不同来源的数据汇集在一起来简化数据分析。Cloud Bigtable 是谷歌云的全托管 NoSQL 数据库，主要用

03

HBase 学习一（基础入门）.

HBase 是一个分布式的、面向列的开源数据库，该技术来源于 Fay Chang 所撰写的 Google 论文 “Bigtable：一个结构化数据的分布式存储系统” 。就像 Bigtable 利用了 Google 文件系统（File System）所提供的分布式数据存储一样，HBase 在 Hadoop 之上提供了类似于 Bigtable 的能力。HBase 是 Apache 的 Hadoop 项目的子项目。HBase 不同于一般的关系数据库，它是一个适合于非结构化数据存储的数据库。另一个不同的是 HBase 基于列的而不是基于行的模式。

04

Hbase原理系列--成员

HBASE是一个高可靠性、高性能、面向列、可伸缩、稀疏的分布式存储系统，利用HBASE技术可在廉价PC Server上搭建起大规模结构化存储集群。

01

FunData — 电竞大数据系统架构演进

背景来源：FunData作为电竞数据平台，v1.0 beta版本主要提供由Valve公司出品的顶级MOBA类游戏DOTA2相关数据接口(详情：open.varena.com)。数据对比赛的观赏性和专业性的提高起到至关重要的作用。本文由IT大咖说（微信id：itdakashuo）整理，经投稿者与嘉宾审阅授权发布。

03

工作还是游戏？程序员：我选择边玩游戏边工作！

一方面体现在“数据”构造上仍有广阔的待开发空间，另一方面则是应用场景，除了做客观评价和“讲故事”，还需打通更多的商业模式。

02

快速理解HBase和BigTable

有关系行数据库经验的人（比如我），在最初接触HBase这样的数据库时，对数据结构的理解容易遇到障碍。会不自觉的将HBase的行、列等概念映射成关系型数据库的行、列。为了加速理解HBase的一些概念，翻译了这篇文章《Understanding HBase and BigTable》（HBase官方文档推荐阅读文章）。

02

弃用 Lambda，Twitter 启用 Kafka 和数据流新架构

在 Twitter 上，我们每天都要实时处理大约 4000 亿个事件，生成 PB 级的数据。我们使用的数据的事件源多种多样，来自不同的平台和存储系统，例如 Hadoop、Vertica、Manhattan 分布式数据库、Kafka、Twitter Eventbus、GCS、BigQuery 和 PubSub。

02

重温大数据---Hbase部署以及架构分析

简单的说HBase就是一个分布式的可扩展的大数据量的非关系型数据库（NoSQL）。它具有一般的关系型数据 Oracle/MySQL的基础功能如：

02

HBase 简介

Apache HBase 是以 hdfs 为数据存储的，一种分布式、可扩展的 NoSQL 数据库。

02

跟我一起云计算（3）——hbase

hbase HBase是一个分布式的、面向列的开源数据库，该技术来源于 Fay Chang 所撰写的Google论文“Bigtable：一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统（File System）所提供的分布式数据存储一样，HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop 项目的子项目。HBase不同于一般的关系数据库，它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式

05

【DB】HBase的基本概念

一 Hbase是个啥东东？在说Hase是个啥家伙之前，首先我们来看看两个概念。面向行存储和面向列存储。面向行存储。我相信大伙儿应该都清楚，我们熟悉的RDBMS就是此种类型的。面向行存储的数据库主要适合于事务性要求严格场合，或者说面向行存储的存储系统适合OLTP。可是依据CAP理论，传统的RDBMS。为了实现强一致性，通过严格的ACID事务来进行同步，这就造成了系统的可用性和伸缩性方面大大折扣。而眼下的非常多NoSQL产品，包含Hbase，它们都是一种终于一致性的系统，它们为了高的可用性牺牲了一部分的一致性。好像。我上面说了面向列存储，那么究竟什么是面向列存储呢？Hbase,Casandra,Bigtable都属于面向列存储的分布式存储系统。看到这里，假设您不明确Hbase是个啥东东，不要紧，我再总结一下下： Hbase是一个面向列存储的分布式存储系统。它的长处在于能够实现高性能的并发读写操作，同一时候Hbase还会对数据进行透明的切分，这样就使得存储本身具有了水平伸缩性。二 Hbase数据模型 HBase,Cassandra的数据模型很类似。他们的思想都是来源于Google的Bigtable，因此这三者的数据模型很类似，唯一不同的就是Cassandra具有Super cloumn family的概念，而Hbase眼下我没发现。好了。废话少说。我们来看看Hbase的数据模型究竟是个啥东东。在Hbase里面有以下两个基本的概念，Row key,Column Family。我们首先来看看Column family,Column family中文又名“列族”，Column family是在系统启动之前预先定义好的，每个Column Family都能够依据“限定符”有多个column.以下我们来举个样例就会很的清晰了。假如系统中有一个User表。假设依照传统的RDBMS的话。User表中的列是固定的，比方schema 定义了name,age,sex等属性。User的属性是不能动态添加的。可是假设採用列存储系统。比方Hbase。那么我们能够定义User表，然后定义info 列族。User的数据能够分为：info:name = zhangsan,info:age=30,info:sex=male等。假设后来你又想添加另外的属性。这样非常方便仅仅须要info:newProperty就能够了。或许前面的这个样例还不够清晰，我们再举个样例来解释一下。熟悉SNS的朋友，应该都知道有好友Feed，一般设计Feed，我们都是依照“某人在某时做了标题为某某的事情”，可是同一时候一般我们也会预留一下keyword，比方有时候feed或许须要url，feed须要image属性等，这样来说。feed本身的属性是不确定的。因此假设採用传统的关系数据库将很麻烦。况且关系数据库会造成一些为null的单元浪费，而列存储就不会出现这个问题。在Hbase里，假设每个column 单元没有值，那么是占用空间的。

02

如何使用5个Python库管理大数据？

如今，Python真是无处不在。尽管许多看门人争辩说，如果他们不使用比Python更难的语言编写代码，那么一个人是否真是软件开发人员，但它仍然无处不在。

01

HBase shell 命令介绍

HBase shell是HBase的一套命令行工具，类似传统数据中的sql概念，可以使用shell命令来查询HBase中数据的详细情况。安装完HBase之后，如果配置了HBase的环境变量，只要在shell中执行hbase shell就可以进入命令行界面，HBase的搭建可以参考我的上一篇文章：hbase分布式集群搭建

02

实时分析系统（Hive/Hbase/Impala）浅析

1. 什么是实时分析（在线查询）系统？大数据领域里面，实时分析（在线查询）系统是最常见的一种场景，通常用于客户投诉处理，实时数据分析，在线查询等等过。因为是查询应用，通常有以下特点： a. 时延低（秒级别）。 b. 查询条件复杂（多个维度，维度不固定），有简单（带有ID)。 c. 查询范围大（通常查询表记录在几十亿级别）。 d. 返回结果数小（几十条甚至几千条）。 e. 并发数要求高（几百上千同时并发）。 f. 支持SQL（这个业界基本上达成共识了，原因是很难找到一个又会数据分析，还能写JAVA代码的分析

05

HBase RowKey 设计

HBase中 RowKey 用来唯一标识一行记录。在 HBase 中检索数据有以下三种方式：

02

【HBase】HBase之what

2006年末发起，根据Google的Chang等人发表的论文“Bigtable：A Distributed Storage System for Strctured Data“来设计的。

04

一文读懂 HBase 核心原理与应用场景

HBase是大数据NoSQL领域里非常重要的分布式KV数据库，是一个高可靠、高性能、高伸缩的分布式存储系统，目前国内知名公司都有在大规模使用，社区也非常活跃。本文就是学习HBase的敲门砖，主要从以下几个方面解读HBase。

03

大数据入门：Hbase Rowkey设计

在Hadoop技术生态体系当中，Hbase作为分布式数据库而存在，也可以说是业界最早最经典的一个分布式数据库。Hbase的原型来自Google的BigTable，各方面性能优异，这其实得益于Hbase的内部设计。今天的大数据入门分享，我们就来具体讲讲，Hbase Rowkey设计。

01

HBase快速入门系列(1) | Hbase的简单介绍

HBase的原型是Google的BigTable论文，受到了该论文思想的启发，目前作为Hadoop的子项目来开发维护，用于支持结构化的数据存储。官方网站：http://hbase.apache.org – 2006年Google发表BigTable白皮书 – 2006年开始开发HBase – 2008年北京成功开奥运会，程序员默默地将HBase弄成了Hadoop的子项目 – 2010年HBase成为Apache顶级项目 – 现在很多公司二次开发出了很多发行版本，你也开始使用了。 HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统，利用HBASE技术可在廉价PC Server上搭建起大规模结构化存储集群。 HBase的目标是存储并处理大型的数据，更具体来说是仅需使用普通的硬件配置，就能够处理由成千上万的行和列所组成的大型数据。 HBase是Google Bigtable的开源实现，但是也有很多不同之处。比如：Google Bigtable利用GFS作为其文件存储系统，HBase利用Hadoop HDFS作为其文件存储系统；Google运行MAPREDUCE来处理Bigtable中的海量数据，HBase同样利用Hadoop MapReduce来处理HBase中的海量数据；Google Bigtable利用Chubby作为协同服务，HBase利用Zookeeper作为对应。

01

Hbase的快速使用

HBase是基于HDFS之上的，也可以采用存储本地模式，HBase是分布式数据库，将数据分为多份，同时是面向列的数据库，是bigtable的实现。

02

HBase入门与基本使用

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

05

数据仓库组件：HBase集群环境搭建和应用案例

Hadoop原生的特点是解决大规模数据的离线批量处理场景，HDFS具备强大存储能力，但是并没有提供很强的数据查询机制。HBase组件则是基于HDFS文件系统之上提供类似于BigTable服务。

02

HBase在人资数据预处理平台中的实践

物流人资数据预处理平台，负责接收一线几十万员工不同条线的工作量，每日数据量约2000w，系统负责加工转换并提供数据查询的同时，还需保证查询性能，以及修改单个业务量功能。本文通过HBase在物流人资数据预处理平台中实践，讲解HBase集群如何协同工作，并概述读取数据以及存储数据的原理，以及使用HBase注意事项。

02

大数据技术之_1

从图中可以看出 Hbase 是由 Client、Zookeeper、Master、HRegionServer、HDFS 等几个组件组成，下面来介绍一下几个组件的相关功能：

03

第一天：Hbase 概述

HBase的原型是Google的BigTable论文，受到了该论文思想的启发，目前作为Hadoop的顶级项目来开发维护，用于支持结构化的数据存储。

02

Hbase 技术细节笔记（上）

前言最近在跟进Hbase的相关工作，由于之前对Hbase并不怎么了解，因此系统地学习了下Hbase，为了加深对Hbase的理解，对相关知识点做了笔记，并在组内进行了Hbase相关技术的分享，由于Hb

09

Hbase 技术细节笔记（上）

07

《HBase 权威指南》学习笔记一引言

解决数据库多写问题，同事推荐使用hbase，并做了HBase培训，也看到老大tim参会说淘宝用hbase替代部分mysql核心应用，学习研究下看是否适用分布式计算的谬论.： 1 The network is reliable. 2 Latency is zero. 3 Bandwidth is infinite. 4 The network is secure. 5 Topology doesn't change. 6 There is one administrator. 7 Transport cos

08

HBase的表结构你设计得不对！

正如我在前面章节强调的，HBase数据模型跟关系型数据库系统有非常大的差异。因此，设计Hbase的数据表的方法和思路跟关系型数据库不一样。设计HBASE表应该在具体业务场景的上下文中回答以下问题：

01

浅谈HBase

“ 数据的价值已经超越了传统企业广泛认同的价值边界，海量数据的存储将是企业所面临的的挑战。HBase正是这种背景下的产物，用以存储海量数据的，支持高并发、高性能、高可用、可伸缩、列存储等特性”

02

Mesa——谷歌揭开跨中心超速数据仓库的神秘面纱

点击标题下「大数据文摘」可快捷关注大数据文摘翻译翻译/于丽君校对/瑾儿小浣熊转载请保留摘要：谷歌近期发表了一篇关于最新大数据系统的论文，是关于Mesa这一全球部署的数据仓库，它可以在数分钟内提取上百万行，甚至可以在一个数据中心发生故障时依然运作。谷歌正在为其一项令人兴奋的产品揭开面纱，它可能成为数据库工程史上的又一个壮举，这就是一个名为Mesa的数据仓库系统，它可以处理几乎实时的数据，并且即使一整个数据中心不幸脱机也可以发挥它的性能。谷歌工程师们正在为下个月将在中国举行的盛大的数据库会议准备展示

06

MESA：谷歌揭开跨中心超速数据仓库的神秘面纱

大数据文摘翻译:于丽君／校对:瑾儿小浣熊(转载请保留) 摘要：谷歌近期发表了一篇关于最新大数据系统的论文，是关于Mesa这一全球部署的数据仓库，它可以在数分钟内提取上百万行，甚至可以在一个数据中心发生故障时依然运作。谷歌正在为其一项令人兴奋的产品揭开面纱，它可能成为数据库工程史上的又一个壮举，这就是一个名为Mesa的数据仓库系统，它可以处理几乎实时的数据，并且即使一整个数据中心不幸脱机也可以发挥它的性能。谷歌工程师们正在为下个月将在中国举行的盛大的数据库会议准备展示其关于Mesa的论文。该篇论文的

Hbase协处理器介绍

（一）Hbase协处理器的前世今生 Hbase是仿照Google的BigTable设计的，而其协处理器也是仿照BigTable的协处理实现完成的，具体链接可参考：http://research.google.com/people/jeff/SOCC2010-keynote-slides.pdf （二）什么是Hbase协处理器（Coprocessors ）？ Hbase的协处理器在Hbase中属于高级的应用功能，它可以让开发者自定义的代码在服务器端执行，来完成特定的一些功能。（三）为什

09

OpenTSDB简介

OpenTSDB(Open time series data base)，开发时间序列数据库。DB这个词很有误导性，其实并不是一个db，单独一个OpenTSDB无法存储任何数据，它只是一层数据读写的服务，更准确的说它只是建立在Hbase上的一层数据读写服务。行业内各种db都很多了，为什么还会出现它？它到底有什么好？它做了什么？别着急，我们来一一分析下。　　其实OpenTSDB不是一个通用的数据存储服务，看名字就知道，它主要针对于时序数据。什么是时序数据，股票的变化趋势、温度的变化趋势、系统某个指标的变化趋势……其实都是时序数据，就是每个时间点上纪录一条数据。关于数据的存储，我们最熟悉的就是mysql了，但是想想看，每5分钟存储一个点，一天288个点，一年就10万+，这还是单个维度，往往在实际应用中维度会非常多，比如股票交易所，成千上万支股票，每天所有股票数据就可能超过百万条，如果还得支持历史数据查询，mysql是远远扛不住的，必然要考虑分布式存储，最好的选择就是Hbase了，事实上业内基本上也是这么做的。（我对其他分布式存储不了解，就不对比了）。　　了解Hbase的人都知道，它可以通过加机器的水平扩展迅速增加读写能力，非常适合存储海量的数据，但是它并不是关系数据库，无法进行类似mysql那种select、join等操作。取而代之的只有非常简单的Get和Scan两种数据查询方式。这里不讨论Hbase的相关细节，总之，你可以通过Get获取到hbase里的一行数据，通过Scan来查询其中RowKey在某个范围里的一批数据。如此简单的查询方式虽然让hbase变得简单易用，但也限制了它的使用场景。针对时序数据，只有get和scan远远满足不了你的需求。　　这个时候OpenTSDB就应运而生。首先它做了数据存储的优化，可以大幅度提升数据查询的效率和减少存储空间的使用。其次它基于hbase做了常用时序数据查询的API，比如数据的聚合、过滤等。另外它也针对数据热度倾斜做了优化。接下来挨个说下它分别是怎么做的。

01

分布式NoSQL列存储数据库Hbase（一）Hbase的功能与应用场景、基本设计思想

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-j3OUucRa-1627099407310)(20210316_分布式NoSQL列存储数据库Hbase（一）.assets/image-20210316180046440.png)]

03

SSTable详解

几年前在读Google的BigTable论文的时候，当时并没有理解论文里面表达的思想，因而囫囵吞枣，并没有注意到SSTable的概念。再后来开始关注HBase的设计和源码后，开始对BigTable传递的思想慢慢的清晰起来，但是因为事情太多，没有安排出时间重读BigTable的论文。在项目里，我因为自己在学HBase，开始主推HBase，而另一个同事则因为对Cassandra比较感冒，因而他主要关注Cassandra的设计，不过我们两个人偶尔都会讨论一下技术、设计的各种观点和心得，然后他偶然的说了一句：Cassandra和HBase都采用SSTable格式存储，然后我本能的问了一句：什么是SSTable？他并没有回答，可能也不是那么几句能说清楚的，或者他自己也没有尝试的去问过自己这个问题。然而这个问题本身却一直困扰着我，因而趁着现在有一些时间深入学习HBase和Cassandra相关设计的时候先把这个问题弄清楚了。

01

从VLDB论文看谷歌广告部门的F1数据库的虚虚实实

最近因为工作需要对VLDB的一些论文进行了阅读。其中包括谷歌新发表的F1数据库的分析。解读谷歌论文一直都是不太容易的。因为谷歌向来都是说一半藏一半。这篇论文相对来说还是写的比较开放的，还是不能免俗。

03

Hbase数据库

基于HDFS: HDFS:hadoop distributed file system:分布式文件系统：多台服务器组成的服务器集群组成的一个文件系统。

02

Hbase入门(三)——数据模型

Hbase最核心但也是最难理解的就是数据模型，由于与传统的关系型数据库不同，虽然Hbase也有表（Table），也有行（Row）和列（Column），但是与关系型数据库不同的是Hbase有一个列族（Column Family）的概念，它将一列或者多列组织在一起，HBase必须属于某一个列族。

02

「数据仓库技术」怎么选择现代数据仓库

我们用过很多数据仓库。当我们的客户问我们，对于他们成长中的公司来说，最好的数据仓库是什么时，我们会根据他们的具体需求来考虑答案。通常，他们需要几乎实时的数据，价格低廉，不需要维护数据仓库基础设施。在这种情况下，我们建议他们使用现代的数据仓库，如Redshift, BigQuery，或Snowflake。

03

HBase容错性和Hbase使用场景、Hbase读写过程详解

该机制用于数据的容错和恢复：每个HRegionServer中都有一个HLog对象，HLog是一个实现Write Ahead Log的类，在每次用户操作写入MemStore的同时，也会写一份数据到HLog文件中（HLog文件格式见后续），HLog文件定期会滚动出新的，并删除旧的文件（已持久化到StoreFile中的数据）。当HRegionServer意外终止后，HMaster会通过Zookeeper感知到，HMaster首先会处理遗留的 HLog文件，将其中不同Region的Log数据进行拆分，分别放到相应region的目录下，然后再将失效的region重新分配，领取到这些region的HRegionServer在Load Region的过程中，会发现有历史HLog需要处理，因此会Replay HLog中的数据到MemStore中，然后flush到StoreFiles，完成数据恢复。

02

Hbase（一）了解Hbase与Phoenix

HBase是一个分布式的、面向列的开源数据库，该技术来源于 Fay Chang 所撰写的Google论文“Bigtable：一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统（File System）所提供的分布式数据存储一样，HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库，它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。

03

kylin调优，项目中错误总结，知识点总结，kylin jdbc driver + 数据库连接池druid + Mybatis项目中的整合，shell脚本执行kylin restapi 案例

该机制用于数据的容错和恢复：每个HRegionServer中都有一个HLog对象，HLog是一个实现Write Ahead Log的类，在每次用户操作写入MemStore的同时，也会写一份数据到HLog文件中（HLog文件格式见后续），HLog文件定期会滚动出新的，并删除旧的文件（已持久化到StoreFile中的数据）。当HRegionServer意外终止后，HMaster会通过Zookeeper感知到，HMaster首先会处理遗留的 HLog文件，将其中不同Region的Log数据进行拆分，分别放到相应region的目录下，然后再将失效的region重新分配，领取到这些region的HRegionServer在Load Region的过程中，会发现有历史HLog需要处理，因此会Replay HLog中的数据到MemStore中，然后flush到StoreFiles，完成数据恢复。

02

HBase 分布式数据库

在5、6年前，我们就希望能用分布式存储和分布式数据库来替代集中存储，觉得分布式廉价，而且高可靠。

02

Hbase

最近在逐步跟进Hbase的相关工作，由于之前对Hbase并不怎么了解，因此系统地学习了下Hbase，为了加深对Hbase的理解，对相关知识点做了笔记，并在组内进行了Hbase相关技术的分享，由于Hbase涵盖的内容比较多，因此计划分享2期，下面就是针对第一期Hbase技术分享整体而成，第一期的主要内容如下:

07

Hbase技术详解

为了加深对Hbase的理解，对相关知识点做了笔记，并在组内进行了Hbase相关技术的分享，由于Hbase涵盖的内容比较多，因此计划分享2期，下面就是针对第一期Hbase技术分享整体而成，第一期的主要内容如下:

01

Hbase 入门知识点总结

其源于 Google 三大论文之一的 bigtable ，是一个具有高可靠性、高性能、面向列、可伸缩的分布式存储系统，简单来说就是一个数据库。

03

Hbase性能优化百科全书

本文集合了小编在日常学习和生产实践中遇到的使用Hbase中的各种问题和优化方法，分别从表设计、rowkey设计、内存、读写、配置等各个领域对Hbase常用的调优方式进行了总结，希望能对读者有帮助。本文参考结合自己实际优化经验，参考了大量官网和各个前辈的经验，调优后生产环境中的Hbase集群支撑了约50万/s的读和25万/s的写流量洪峰。感谢各位的经验和付出。

05

【图文详解】HBase 的数据模型与架构原理详解

HBase， Hadoop Database，是一个高可靠性、高性能、面向列、可伸缩、实时读写的分布式开源 NoSQL 数据库，面向列存储。主要用来存储非结构化和半结构化的松散数据。

01

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭