hbase开发_hbase 开发_hbase开发环境 - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

成为大数据工程师必备的技能有哪些？（上）

http://www.aboutyun.com/thread-11873-1-1.html

03

0540-5.15.0-Spark2使用HBase-Spark访问HBase

越来越多的用户使用Spark对接HBase，对接HBase的方式有多种，通过HBase-client API实现，也有直接Spark On HBase的方式实现，比较常见的有华为的Spark-SQL-on-HBase，Hortonworks的Apache HBase Connector和Cloudera提供的SparkOnHBase，目前Cloudera的SparkOnHBase已提交的HBase的主干版本。本篇文章Fayson主要在Spark2环境下使用Cloudera的SparkOnHBase访问HBase。

04

您找到你想要的搜索结果了吗？

是的

没有找到

HBase开发： Java API 管理表

发布者：全栈程序员栈长，转载请注明出处：https://javaforall.cn/160427.html原文链接：https://javaforall.cn

04

大数据时代的结构化存储-HBase的应用实践

时间回到2011年，Hadoop作为新生事物，在阿里巴巴已经玩得风生水起，上千台规模的"云梯"是当时国内名声显赫的计算平台。这一年，Hadoop的好兄弟HBase由毕玄大师带入淘宝，开启了它的阿里之旅。从最初的淘宝历史交易记录，到去年的支付宝消费记录存储在线历史存储统一；从蚂蚁安全风控的多年存储演进，到HBase、TT、Galaxy的大数据激情迭代；HBase在阿里经历过年轻的苦涩，释放过青春的活力，也付出过成长的代价。几代人的不懈努力下，五年陈的HBase开始表现出更成熟、更完善、更丰富的一面，成为公司内部被广泛使用的存储产品之一。经过阿里集团内部的锤炼，集团将这个技术红利输送给广大阿里云客户。现已推出云数据库HBase产品，支持海量的PB级的大数据存储，适用于高吞吐的随机读写的场景。

02

进阶指南｜三个月大数据工程师学习计划

本文来自作者在GitChat（ID：GitChat_Club）上的精彩分享，CSDN独家合作发布。申明：本文旨在为普通程序员（Java程序员最佳）提供一个入门级别的大数据技术学习路径，不适用于大数据工程师的进阶学习，也不适用于零编程基础的同学。前言一、背景介绍本人目前是一名大数据工程师，项目数据50T，日均数据增长20G左右，个人是从Java后端开发，经过3个月的业余自学成功转型大数据工程师。二、大数据介绍大数据本质也是数据，但是又有了新的特征，包括数据来源广、数据格式多样化（结构化数据、非

Apache Kudu 架构

从Impala在Kudu中创建新表类似于将现有Kudu表映射到Impala表，除了您需要自己指定模式和分区信息。使用以下示例作为指导。Impala首先创建表，然后创建映射。

03

大数据技术学习：Hbase应该怎么学？

大数据中HBase是一个分布式的、面向列的开源数据库，Hbase的名字的来源是Hadoop database，即hadoop数据库， HBase中的所有数据文件都存储在Hadoop HDFS文件系统上

03

HBase二次开发之搭建HBase调试环境，如何远程debug HBase源代码

之前的文章也提到过，最近工作中需要对HBase进行二次开发（参照HBase的AES加密方法，为HBase增加SMS4数据加密类型）。研究了两天，终于将开发流程想清楚并搭建好了debug环境，所以就迫不及待地想写篇文章分享给大家。

04

分布式NoSQL列存储数据库Hbase_MR集成Hbase：读写Hbase规则（九）

文章目录分布式NoSQL列存储数据库Hbase（九）知识点01：课程回顾知识点02：课程目标知识点03：MR集成Hbase：读Hbase规则知识点04：MR集成Hbase：读Hbase实现知识点05：MR集成Hbase：写Hbase规则知识点06：MR集成Hbase：写Hbase实现知识点07：BulkLoad的介绍知识点08：BulkLoad的实现知识点09：ImportTSV的使用知识点10：协处理器的介绍知识点11：协处理器的实现知识点12：Hbase优化：内存分配知识点

01

大数据开发岗面试复习30天冲刺 - 日积月累，每日五题【Day13】——Hbase7

大数据开发岗大厂面试30天冲刺 - 日积月累，每日五题【Day01】——Hive1

04

HBase操作组件：Hive、Phoenix、Lealone

hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的sql查询功能，可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低，可以通过类SQL语句快速实现简单的MapReduce统计，不必开发专门的MapReduce应用，十分适合数据仓库的统计分析。

04

Hadoop生态上几个技术的关系与区别：hive、pig、hbase 关系与区别

初接触Hadoop技术的朋友肯定会对它体系下寄生的个个开源项目糊涂了，我敢保证Hive,Pig,HBase这些开源技术会把你搞的有些糊涂，不要紧糊涂的不止你一个，如某个菜鸟的帖子的疑问，when to use Hbase and when to use Hive？....请教了^_^没关系这里我帮大家理清每个技术的原理和思路。

02

大数据开发岗面试复习30天冲刺 - 日积月累，每日五题【Day13】——Hbase7

•MapReduce写入Hbase原理：封装了一个TableOutputFormat来实现写入Hbase的数据 •要求 –写入Hbase的数据的V的类型必须为Put类型

02

hdfs hbase hive hbase分别的适用场景

不想用程序语言开发MapReduce的朋友，熟悉SQL的朋友可以使用Hive开离线的进行数据处理与分析工作。

02

hdfs hbase hive hbase分别的适用场景

不想用程序语言开发MapReduce的朋友，熟悉SQL的朋友可以使用Hive开离线的进行数据处理与分析工作。

02

Hadoop生态上几个技术的关系与区别：hive、pig、hbase 关系与区别

一种操作hadoop的轻量级脚本语言，最初又雅虎公司推出，不过现在正在走下坡路了。当初雅虎自己慢慢退出pig的维护之后将它开源贡献到开源社区由所有爱好者来维护。不过现在还是有些公司在用，不过我认为与其使用pig不如使用hive。：）

01

大数据应用之Windows平台Hbase客户端Eclipse环境搭建-Java版

大数据的场景下，NoSql型数据库的优势不言而喻，但是涉及NoSQL数据库的实际动手开发的东西多是Linux平台，大多语焉不详，至于Windows平台介绍的东西就更少了，而且大多无法运行。本文就Windows平台基于Eclipse搭建Hbase环境客户端开发环境做一个介绍。另外基于Thrift实现的Windows版本Hbase客户端库也做了封装，有需要的可以留言索取。

06

大数据那些事(18):亲儿子不如干儿子

这篇再填一下Key-Value Store的坑。很多时候亲生的不如领养的事情一般不会发生。但是在大数据的世界里，什么都有可能。BigTable和Dynamo是两个最著名的Key-Value Store。它们的实现各有不同，功能各有差异。无论是BigTable还是Dynamo，开源都有对应的实现，分别是HBase和Cassandra。我们简单回顾一下，BigTable是一个multi-dimension persistent sorted map。其基本核心思想是用chubby来做metadata dis

[平台建设] HBase平台建设实践

因为列族在创建表的时候是确定的，列名以列族作为前缀，按需可动态加入，如: cf:name, cf:age

01

对比使用Phoenix组件和原生Hbase查询的时间性能

之前对于使用Phoenix查询Hbase大表数据一直卡死，于是搁置了好久，昨晚终于尝试了一下，完美搞定，本节文章来使用4种方法对比Hbase查询性能。

02

快速学习-HBase简介

HBase的原型是Google的BigTable论文，受到了该论文思想的启发，目前作为Hadoop的子项目来开发维护，用于支持结构化的数据存储。官方网站：http://hbase.apache.org – 2006年Google发表BigTable白皮书 – 2006年开始开发HBase – 2008年北京成功开奥运会，程序员默默地将HBase弄成了Hadoop的子项目 – 2010年HBase成为Apache顶级项目 – 现在很多公司二次开发出了很多发行版本，你也开始使用了。 HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统，利用HBASE技术可在廉价PC Server上搭建起大规模结构化存储集群。 HBase的目标是存储并处理大型的数据，更具体来说是仅需使用普通的硬件配置，就能够处理由成千上万的行和列所组成的大型数据。 HBase是Google Bigtable的开源实现，但是也有很多不同之处。比如：Google Bigtable利用GFS作为其文件存储系统，HBase利用Hadoop HDFS作为其文件存储系统；Google运行MAPREDUCE来处理Bigtable中的海量数据，HBase同样利用Hadoop MapReduce来处理HBase中的海量数据；Google Bigtable利用Chubby作为协同服务，HBase利用Zookeeper作为对应。

02

《NoSQL实战：企业级大数据应用开发入门、实战与进阶》(WIP)

Apache HBase是一种NoSQL键/值存储系统，它在Hadoop分布式文件系统（HDFS）上运行。

03

HBase快速入门系列(1) | Hbase的简单介绍

HBase的原型是Google的BigTable论文，受到了该论文思想的启发，目前作为Hadoop的子项目来开发维护，用于支持结构化的数据存储。官方网站：http://hbase.apache.org – 2006年Google发表BigTable白皮书 – 2006年开始开发HBase – 2008年北京成功开奥运会，程序员默默地将HBase弄成了Hadoop的子项目 – 2010年HBase成为Apache顶级项目 – 现在很多公司二次开发出了很多发行版本，你也开始使用了。 HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统，利用HBASE技术可在廉价PC Server上搭建起大规模结构化存储集群。 HBase的目标是存储并处理大型的数据，更具体来说是仅需使用普通的硬件配置，就能够处理由成千上万的行和列所组成的大型数据。 HBase是Google Bigtable的开源实现，但是也有很多不同之处。比如：Google Bigtable利用GFS作为其文件存储系统，HBase利用Hadoop HDFS作为其文件存储系统；Google运行MAPREDUCE来处理Bigtable中的海量数据，HBase同样利用Hadoop MapReduce来处理HBase中的海量数据；Google Bigtable利用Chubby作为协同服务，HBase利用Zookeeper作为对应。

01

大数据应用之Windows平台Hbase客户端Eclipse开发环境搭建

大数据的场景下，NoSql型数据库的优势不言而喻，但是涉及NoSQL数据库的实际动手开发的东西多是Linux平台，大多语焉不详，至于Windows平台介绍的东西就更少了，而且大多无法运行。本文就Windows平台基于Eclipse搭建Hbase环境客户端开发环境做一个介绍。另外基于Thrift实现的Windows版本Hbase客户端库也做了封装，有需要的可以留言索取。

02

新数仓系列：Hbase国内开发者生存现状（2）

大数据前几年各种概念争论很多，NoSQL/NewSQL，CAP/BASE概念一堆堆的，现在这股热潮被AI接过去了。大数据真正落地到车联网，分控，各种数据分析等等具体场景。概念很高大上，搞得久了就会发现，大部分都还是数据仓库的衍伸，所以我们称呼这个为“新数仓”，我准备写一系列相关的文章，有没有同学愿意一起来的？请联系我。前面有一些相关文章，大家可以看看：新数仓系列：Hbase周边生态梳理（1）本文简单梳理下其中一个应用比较广的HBASE的国内开发者现状，可能不全，有更多信息或者纠正的，请给我留言。 1

06

缓慢但胜在稳健，HBase大势已成

【编者按】对比传统RDBMS领域，NoSQL界的厮杀显然更加激烈。而在这场没有硝烟的战场中，MongoDB和Cassandra无疑是风头最劲的两个产品。但是如果你着眼HBase，各大热门技术（比如Spark、Hadoop）及知名厂商（比如微软、Splice Machine）的支持无疑描绘出一个更美好的未来，下面我们一起看Gigaom Andrew带来的分析。以下为译文：在NoSQL数据库领域，统治产品无疑当属MongDB和DataStax Enterprise（一个领先的Apache Cassand

05

【观点】NoSQL市场两分格局是个伪命题, HBase有望后来居上

在NoSQL数据库领域，统治产品无疑当属MongDB和DataStax Enterprise（一个领先的Apache Cassandra发行版）。但近来MongoDB，甚至整个NoSQL数据库市场不断遭受IT业界质疑，认为“大数据时代NoSQL并非颠覆性技术”，MongoDB技术门槛不高，其市场正面临Teradata、MemSQL和Heroku的威胁。这使得很多潜在用户开始担心——MongoDB的成功是否建立在过度的炒作之下。在Mongo DB遭受质疑的同时, 媒体开始关注一个顽强，但

07

如何使用Java连接Kerberos的HBase

出于CDH集群安全考虑，在CDH集群中增加了Kerberos认证机制。因为HBase的存储系统是基于Hadoop的存储，所以通过HBase客户端访问HBase数据库时需要进行身份认证。在Linux下使用HBase客户端访问HBase数据时需要先kinit初始化Kerberos账号，认证完成后我们就可以直接使用HBase shell操作HBase了。通过Linux的Kinit命令可以方便的完成Kerberos的认证，那么在Java开发中如何完成Kerberos的登录认证呢？本篇文章主要讲述如何使用Java连接Kerberos环境的HBase。

08

Zetta：HBase 用户的新选择 —— 当知乎遇上 TiDB 生态

本篇文章整理自知乎在线基础架构负责人白瑜庆在 PingCAP Infra Meetup 上的演讲实录。本文讲述了知乎与 TiDB 的渊源，介绍了一款基于 TiDB 生态研发的开源产品 Zetta，能够在规避 HBase 性能问题同时，减小 TiDB 部署后分布式架构下的系统延迟。

02

HBase2.0新特性详解顶

个推作为专业的数据智能服务商，在业务开展过程中存在海量的数据存储与查询的需求，为此个推选用了高可靠、高性能、面向列、可伸缩的分布式数据存储系统——HBase。

01

通过Thrift实现C#与Hbase交流

近期着手的一个项目需要将我方数据存储到Hadoop的大数据环境，由于本人是.net平台的开发者，没有怎么接触过大数据（因为他实在是太高大尚了）。但还好baidu, google后，还是很找到了解决办法，就是C#写数据到hbase，然后大数据开发者在从hbase读取数据进行多维度处理，如将一部分历史数据转移到hive，或者是将一部分数据推送到机器学习库进行学习。

01

Hbase+Solr实现二级索引提供高效查询

接着上一篇介绍协处理器的文章http://qindongliang.iteye.com/blog/2277145，本篇我们来实战一个例子，看下如何使用协处理来给Hbase建立二级索引。 github地址：https://github.com/qindongliang/hbase-increment-index 业务需求：现有一张Hbase的表，数据量千万级+，而且不断有新的数据插入，或者无效数据删除，每日新增大概几百万数据，现在已经有离线的hive映射hbase 提供离线查询，但是由于性能

06

大数据【企业级360°全方位用户画像】匹配型标签开发

经过了用户画像，标签系统的介绍，又经过了业务数据调研与ETL处理之后，本篇博客，我们终于可以迎来【企业级用户画像】之标签开发。

03

大数据【企业级360°全方位用户画像】匹配型标签累计开发

写在前面：博主是一名大数据的初学者，昵称来源于《爱丽丝梦游仙境》中的Alice和自己的昵称。作为一名互联网小白，写博客一方面是为了记录自己的学习历程，一方面是希望能够帮助到很多和自己一样处于起步阶段的萌新。由于水平有限，博客中难免会有一些错误，有纰漏之处恳请各位大佬不吝赐教！个人小站:http://alices.ibilibili.xyz/ , 博客主页:https://alice.blog.csdn.net/ 尽管当前水平可能不及各位大佬，但我还是希望自己能够做得更好，因为一天的生活就是一生的缩影。

03

上帝视角Hbase二级索引方案全解析

HBase中的一级索引指数据在写入region时，会根据rowkey进行排序后写入，之后regionserver在加载region时，会自动为当前region的rowkey创建一个LSM树的索引,方便对当前region,rowkey的查询。

02

YCSB测试HBase远程完全分布式集群

本文只讲一个很简单的问题，YCSB对HBase集群的测试。虽然网上有很多介绍YCSB测试HBase的文章，但都是针对本地HBase伪分布式集群的。大家都知道，稍微正式一些的压测都会要求测试客户端与目标集群分离部署，而且伪分布式集群通常不会在生产环境下使用，本身也没有太大的压测意义。本文会着重介绍一下压测远程HBase完全分布式集群的不同之处。

02

用户画像标签系统体系解释

1）、标签数据标签管理平台中，每个标签开发时，首先需要在管理平台上注册（新建标签：4级标签和5级标签）业务标签和属性标签业务标签对应标签模型，每个标签模型就是Spark Application，运行程序可以给用户打上标签：TagName 模型表中存储数据：spark application运行时参数设置核心数据： tagName -> tagRule：标签规则

02

大数据和云计算技术周报（第44期）:NoSQL特辑

https://mp.weixin.qq.com/s/TdnZeG8rRYwTfopEyTxmpQ

01

HBase伪分布式安装(HDFS)+ZooKeeper安装+HBase数据操作+HBase架构体系

本文介绍了如何使用HBase和ZooKeeper实现一个高可用的分布式系统。首先介绍了HBase和ZooKeeper的基本概念和架构，然后详细讲解了如何使用HBase和ZooKeeper实现一个高可用的分布式系统。最后通过一个具体的实例展示了如何使用HBase和ZooKeeper实现分布式系统，并提供了相应的代码示例。

08

大数据和云计算技术周报（第42期）:NoSQL特辑

①本文对hbase连接方式进行了深入剖析，也是开发中经常遇到的问题，踩过不少坑，跟大家分享一下此文。

01

如何使用scala+spark读写hbase？

最近工作有点忙，所以文章更新频率低了点，希望大家可以谅解，好了，言归正传，下面进入今天的主题：如何使用scala+spark读写Hbase 软件版本如下： scala2.11.8 spark2.1.0 hbase1.2.0 公司有一些实时数据处理的项目，存储用的是hbase，提供实时的检索，当然hbase里面存储的数据模型都是简单的，复杂的多维检索的结果是在es里面存储的，公司也正在引入Kylin作为OLAP的数据分析引擎，这块后续有空在研究下。接着上面说的，hbase存储着一些实时的数据，前两周新需求

07

Kylin快速入门系列(1) | Kylin的简单介绍及安装部署

Apache Kylin是一个开源的分布式分析引擎，提供Hadoop/Spark之上的SQL查询接口及多维分析（OLAP）能力以支持超大规模数据，最初由eBay开发并贡献至开源社区。它能在亚秒内查询巨大的Hive表。

01

大数据和云计算技术周报（第36期）:NoSQL特辑

本期有 HBase入门、HBase集群监控、Kudu vs HBase、Flush与Compaction、MySQL索引优化、Redis 分布式锁。希望大家会喜欢！

01

图文简述HBase的用途（二）

昨天，我们讲到了HBase的逻辑结构，今天我们来看一下HBase的存储及访问原理。

01

Docker下HBase学习，三部曲之一：极速体验

本文介绍了如何在Docker环境下极速体验HBase。通过运行CentOS 7虚拟机，并安装和配置HBase，然后使用Docker启动并运行HBase集群。最后，使用HBase Shell命令以及Java API进行HBase的增删改查操作。

07

《用户画像：方法论与工程化解决方案》读书笔记第3章

在画像系统搭建的过程中，数据存储的技术选型是非常重要的一项内容，不同的存储方式适用于不同的应用场景。本章主要介绍使用Hive、MySQL、HBase、Elasticsearch存储画像相关数据的应用场景及对应的解决方案。

02

HBase 学习分享

本文主要介绍了HBase在技术社区中的应用和优化，包括通过HBase解决用户画像、活动实时监控、用户实时在线等场景。HBase作为一个高可靠性、高性能、面向列的分布式存储系统，在技术社区中发挥着重要作用。

00

如何使用Java访问非Kerberos环境的HBase

在前面的文章Fayson介绍了《如何使用Java连接Kerberos的HBase》，虽然非Kerberos环境下访问HBase比较简单，本篇文章Fayson还是主要介绍使用Java访问非Kerberos环境的HBase。

04

大数据开发岗面试复习30天冲刺 - 日积月累，每日五题【Day07】——Hbase1

•功能：Hbase是一个分布式的、基于分布式内存和HDFS的按列存储的NoSQL数据库 •应用：Hbase适合于需要实时的对大量数据进行快速、随机读写访问的场景

05

HBase入门介绍(从基础到架构)

hbase是bigtable的开源java版本。是建立在hdfs之上，提供高可靠性、高性能、列存储、可伸缩、实时读写nosql的数据库系统。

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭