新数仓系列:Hbase国内开发者生存现状(2)

大数据前几年各种概念争论很多,NoSQL/NewSQL,CAP/BASE概念一堆堆的,现在这股热潮被AI接过去了。大数据真正落地到车联网,分控,各种数据分析等等具体场景。

概念很高大上,搞得久了就会发现,大部分都还是数据仓库的衍伸,所以我们称呼这个为“新数仓”,我准备写一系列相关的文章,有没有同学愿意一起来的?请联系我。前面有一些相关文章,大家可以看看:

新数仓系列:Hbase周边生态梳理(1)

本文简单梳理下其中一个应用比较广的HBASE的国内开发者现状,可能不全,有更多信息或者纠正的,请给我留言。

1 - 社区

1 国内commiter现状:

目前国内一共10个committer。4个在小米,4个在阿里,一个是小米前员工离职创业去了,一个在英特尔。小米历史上的5个committer,四个是在小米当选的,一个是在豌豆荚当committer后过来的 @张铎还成为国内第一个HBase PMC member。

阿里的话有国内第一个committer,这四个committer分别属于三个大部门。

消息来源:知乎上杨肉(HBase Committer)的回答,这个兄弟又从小米跳槽到一个AI创业公司了。

https://www.zhihu.com/question/27598510

2 和国外的互动

随着PMC、Committer的增多,也逐渐和社区互动起来,2017第一次举行HBaseCon Asia,华为主办的。

http://developer.51cto.com/art/201708/547605.htm

3 技术社区:

好像没有看到一个影响力比较大的统一技术社区,如果有更多信息的同学告诉我?

· hbase-help:http://hbase-help.com/

· csdn HBase资料库:http://lib.csdn.net/hbase/node/734

2 - 商业应用

4 各大公司的实践

阿里Hbase大牛封神整理的,具体链接: https://yq.aliyun.com/articles/169085?spm=5176.100239.blogrightarea176102.19.pH0StL

基本围绕在用户画像、安全风控、订单存储、交通轨迹、物理网、监控、大数据中间存储、搜索、推荐等方面:

· 阿里巴巴-大数据时代的结构化存储HBase在阿里的应用实践:讲述在阿里巴巴集团的实践,HBase在阿里集团已经10000台左右,主要在订单、监控、风控、消息、大数据计算等领域使用

· 阿里巴巴搜索-Hbase在阿里巴巴搜索中的完美应用实践:讲述在搜索场景下hbase的应用及相关的改进

· 日均采集1200亿数据点,腾讯千亿级服务器监控数据存储实践:本文将从当前存储架构存在的问题出发,介绍从尝试使用 Opentsdb 到自行设计 Hbase 存储方案来存储 TMP 服务器海量监控数据的实践历程。

· 滴滴-HBase在滴滴出行的应用场景和最佳实践:统计结果、报表类数据、原始事实类数据、中间结果数据、线上系统的备份数据的一些应用

· HBase在京东的实践 :跟阿里一样,京东各个业务线使用了HBase,如:风控、订单、商品评价等

· 中国人寿基于HBase的企业级大数据平台:使用一个大跨表存储所有的保单,HBase宽表的实践

· HBase在Hulu的使用和实践:用户画像、订单存储系统、日志存储系统的使用

· Apache HBase at Netease:在报表、监控、日志类业务、消息类业务、推荐类业务、风控类业务有所使用,另外讲述了一些优化的点。

· 10 Million Smart Meter Data with Apache HBase:讲述Hitachi为什么选择hbase及在HBase方面的应用

· G7:如何用云计算链接30万车辆--EMR&Hbase 在物联网领域的实践及解决方案 讲述了怎么使用spark及hbase来满足物联网的需求

3 - 云生态

5 国内典型云服务厂商

1)阿里云 云数据库 HBase 版

云数据库 HBase 版(ApsaraDB for HBase)是基于 Hadoop 且100%兼容HBase协议的高性能、可弹性伸缩、面向列的分布式数据库,轻松支持PB级大数据存储,满足千万级QPS高吞吐随机读写场景。

https://www.aliyun.com/product/hbase?spm=5176.8142029.388261.291.3836dbcccdRXId

2)华为云 表格存储服务 CloudTable表格存储服务(CloudTable Service)是华为云基于Apache HBase提供的分布式、可伸缩、全托管的KeyValue数据存储服务,它提供了高性能的随机读写能力,适用于海量结构化数据、半结构化数据以及时序数据的存储和查询应用

http://www.huaweicloud.com/product/cloudtable.html

3)腾讯云 列式数据库HBase

列式数据库HBase(Cloud HBase Service)是腾讯云基于全球广受欢迎的HBase打造的高性能、可伸缩、面向列的分布式存储系统,100%完全兼容HBase协议, 适用于写吞吐量大、海量数据存储以及分布式计算的场景,为您提供稳定丰富的集群管理,弹性可扩展的系统服务。 https://cloud.tencent.com/product/HBase

6 国外典型云服务厂商

这项技术发源美国,所以AWS/Azure/Google技术实力较强。他们实现的都比开源猛!

1)AWS Amazon DynamoDB

适用于任何规模的快速灵活的 NoSQL 数据库服务。

https://aws.amazon.com/cn/dynamodb/?nc2=h_m1

2)Azure 表存储

适用于使用大量半结构化数据集进行快速开发的 NoSQL 键-值存储

https://azure.microsoft.com/zh-cn/services/storage/tables/

3)Google CLOUD BigTable&datastore

BigTableHBASE的始祖,开源Hbase就是抄这个。

一种用于处理大规模分析和运营工作负载的高性能 NoSQL 数据库服务

https://cloud.google.com/bigtable/

Google还在bigdata基础上提供了一个更强事务和SQL能力的datastore

https://cloud.google.com/datastore/

本文主要梳理下Hbase开发者现状,国内用户主要集中在互联网厂商,用户生态比postgresql/Mysql差一些。2016年是IoT爆发的元年,随着Hbase尤其适合的IoT应用的发展,Hbase有很大发展潜力。

原文发布于微信公众号 - 大数据和云计算技术(jiezhu2007)

原文发表时间:2017-12-22

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏沃趣科技

Oracle ASM翻译系列的由来

说一下ASM的历史,在1996年,Oracle ASM最初的架构师Bill Bridge提出了一个新想法,那就是构建Oracle自己的存储管理系统,他在1996...

44680
来自专栏云计算D1net

按需所取、弹性分配的云计算

云计算是一种按使用量付费的模式,这种模式提供可用的、便捷的、按需的网络访问, 进入可配置的计算资源共享池(资源包括网络、服务器、存储、应用软件,服务),这些资源...

59140
来自专栏北京马哥教育

坚持的力量:Facebook向Python3迁移的过程回顾

Python3的使用量在过去几年有了明显增加,但它仍有很长的路要走。使用Python的大公司倾向于在其基础架构上运行Python2.7代码,Facebook也不...

11500
来自专栏芋道源码1024

女博士工程师:聊聊硅谷互联网公司的开发流程

之前很多文章或多或少已经说了一些点,现在很多国内公司也参考了一些流程,最近从始至终参与并负责了两个比较大的项目。这篇文章就系统的说一下开发始终吧。总的说来,我们...

15540
来自专栏CSDN技术头条

SDCC 2015架构专场札记:一线互联网公司的架构实践

【编者按】11月21日,为期三天的SDCC2015中国软件开发者大会成功闭幕,主办方总计邀请了95余位演讲嘉宾,为参会者奉献了10个主题演讲,9大技术专场论坛(...

23270
来自专栏企鹅号快讯

关键词搜索工具分享

Wordtracker关键词搜索工具分享 打开网站,大家可以看到这个界面,直接在搜索框输入产品关键词,可以看到一些关键词,但是关键词的数量并不多。 ? 需要看到...

268100
来自专栏非著名程序员

Google 新操作系统 Fuchsia,UI 设计曝光

? 实在不理解,Google 出了这么多操作系统,到底是为哪样?目的何在,有点让人晕头转向。 据外媒报道称,Google 目前正在努力研发继 Android...

54790
来自专栏ThoughtWorks

TW洞见〡今日最佳答案:为什么互联网公司不开除测试?

点击上方“思特沃克”可以订阅哦! 本篇洞见内容来自知乎。 欢迎点击最底部【阅读原文】跳转至ThoughtWorks官方微博就此问题发表你的看法。 文章末尾另有关...

37650
来自专栏SeanCheney的专栏

《Python分布式计算》 0 序言 (Distributed Computing with Python)作者简介审稿人简介序言本书的内容

Python分布式计算 ---- 作者简介 Francesco Pierfederici是一名喜爱Python的软件工程师。过去20年间,他的工作领域涉及天文学...

40270
来自专栏安恒信息

携程事件启发:监督和审计也是关键

  5月28日下午2点左右,针对携程网站无法打开的事件在朋友圈被刷屏。刚刚开始是各种调侃,其中要求对运维人员好一点的呼声最高、传播最广,然后是携程老板悬赏100...

37140

扫码关注云+社区

领取腾讯云代金券