hbase 性能测试_hbase性能测试_hbase性能 - 腾讯云开发者社区

我们在使用HBase的时候，必须要能够清楚HBase服务端的性能，这对HBase的合理使用以及性能调优都非常重要，所以一般在使用HBase之前，建议做一些必要的基准性能测试，其中，读写P99/P999延时就是一项衡量HBase性能的关键指标。本文首先介绍下HBase自带的性能测试工具——PerformanceEvaluation的使用，然后通过它压测下HBase读写路径P999延时情况。

YCSB测试HBase远程完全分布式集群

本文只讲一个很简单的问题，YCSB对HBase集群的测试。虽然网上有很多介绍YCSB测试HBase的文章，但都是针对本地HBase伪分布式集群的。大家都知道，稍微正式一些的压测都会要求测试客户端与目标集群分离部署，而且伪分布式集群通常不会在生产环境下使用，本身也没有太大的压测意义。本文会着重介绍一下压测远程HBase完全分布式集群的不同之处。

您找到你想要的搜索结果了吗？

是的

没有找到

测试开发进阶：一文教你从0到1搞懂大数据测试！

性能测试-从入门到放弃（写给组内的两名实习生）

2、数据库导论、Oracle数据库管理与开发（数据库应用，何明写的）

NoSQL性能测试工具YCSB-Running a Workload

目前，在系统设计中引入了越来越多的NoSQL产品，例如Redis/ MongoDB/ HBase等，其中性能指标往往会成为权衡不同NoSQL产品的关键因素。对这些产品在性能表现和产品选择上的争论，Ivan碰到不止一次。虽然通过对系统架构原理方面的分析可以大致判断出其在不同读写场景下的表现，但一是对受众有较高的要求，也来的不那么直接。这时候，没有什么比一次性能测试更有说服力。有什么好的性能测试工具呢？这就是今天的主角YCSB。YCSB是Yahoo开源的一套分布式性能测试工具，方便易用，拓展性强。Ivan最近研究HBase二级索引时用它来做性能测试，感觉还是非常顺手的。虽然网上已经有很多YCSB的介绍文章，但用来指导实际操作还是有些不便。Ivan会用两三篇文章来介绍一下YCSB的实际使用。本文是官方文章的译文，选择这篇文章是因为其与具体操作的关系比较紧密，感兴趣的同学可以了解一下。

spark整合hive+hbase做数据实时插入及实时查询分析

使用的spark是2.0.1，hive是1.2.1，hbase是1.2.4，hadoop是2.6.0，zookeeper是3.4.9

大数据应用之HBase数据插入性能优化之多线程并行插入测试案例

上篇文章提起关于HBase插入性能优化设计到的五个参数，从参数配置的角度给大家提供了一个性能测试环境的实验代码。根据网友的反馈，基于单线程的模式实现的数据插入毕竟有限。通过个人实测，在我的虚拟机环境下，单线程插入数据的值约为4w/s。集群指标是：CPU双核1.83，虚拟机512M内存，集群部署单点模式。本文给出了基于多线程并发模式的，测试代码案例和实测结果，希望能给大家一些启示：

值得拥有不容错过的Hive精华汇总

Hive作为Hadoop家族的重要一员，具有学习成本低，开发者可通过类SQL语句快速实现简单的MapReduce统计，不必开发专门的MapReduce应用。在攒库中，Hive也不负众望，得到了非常高的票数。为此，CSDN知识库特邀社区专家蒋守壮（博客： http://blog.csdn.net/jiangshouzhuang ）绘制了Hive技术图谱，帮助广大开发者更加系统、全面的学习Hive技术。 Hive知识库发布，速来关注！我要成为Hive专家团一员，筛选优质内容>>猛戳这里： http://li

运维人员须熟悉的38个运维工具汇总

操作系统：Centos,※,Ubuntu,Redhat※,,suse,Freebsd

千万级数据查询：CK、ES、RediSearch怎么选？

点击上方“芋道源码”，选择“设为星标” 管她前浪，还是后浪？能浪的浪，才是好浪！每天 10:33 更新文章，每天掉亿点点头发... 源码精品专栏原创 | Java 2021 超神之路，很肝~ 中文详细注释的开源项目 RPC 框架 Dubbo 源码解析网络应用框架 Netty 源码解析消息中间件 RocketMQ 源码解析数据库中间件 Sharding-JDBC 和 MyCAT 源码解析作业调度中间件 Elastic-Job 源码解析分布式事务中间件 TCC-Transaction

日吞吐万亿，腾讯云时序数据库 CTSDB 解密

作为腾讯唯一的时序数据库，CTSDB 支撑了腾讯内部20多个核心业务（微信彩票、财付通、云监控、云数据库、云负载等）。

0116

【rainbowzhou 面试9/101】技术提问--常见的大数据基准测试工具有哪些未命名文章

在【rainbowzhou 面试8/101】技术提问--如何进行大数据基准测试？中，我介绍了如何进行大数据基准测试。本篇来说说常见的一些大数据基准测试工具，希望对大家有所帮助。

Elasticsearch 亿级数据检索性能优化案例实战

31-redis

使用redis做缓存数据库，可以把数据存在内存中，加快我们读取数据的速度，同时，它可以定时去同步数据到磁盘，进行内存数据持久化。它还有个重大优势：缓存数据库之间可以自动同步

后端开源软件集合

缓存系统：memcached（group cache）、redis、mongodb、Couchbase（CouchDB、Membase、CouchOne） http缓存：varnish、nginx、traficserver、squid 负载均衡：lvs、f5、nginx、haproxy 代理：nginx 集群操作系统（运行在单机系统上）：Mesos 集群管理：Kubernetes Web服务器：nginx、lighthttpd、apache、tengine WSGI实现： uWSGI、gunicorn We

眼见不一定为实：调用链HBase倾斜修复

今天给大家分享一个关于HBase数据倾斜的排查案例，不懂调用链？不懂HBase？没关系，看完包懂~

使用YCSB进行HBase性能测试

在集群上运行任何性能基准测试工具时，关键的决定始终是应该使用什么数据集大小进行性能测试，并且在这里我们演示了为什么在运行HBase性能时选择“合适的”数据集大小非常重要在您的集群上进行测试。

HBase海量数据高效入仓解决方案

现阶段部分业务数据存储在HBase中，这部分数据体量较大，达到数十亿。大数据需要增量同步这部分业务数据到数据仓库中，进行离线分析，目前主要的同步方式是通过HBase的hive映射表来实现的。该种方式具有以下痛点：

SuperSQL：跨数据源、跨DC、跨执行引擎的高性能大数据SQL中间件

导语：SuperSQL是腾讯数据平台部自研的跨数据源、跨数据中心、跨执行引擎的统一大数据SQL分析平台/中间件，支持对接适配多类外部开源SQL执行引擎，如Spark、Hive等。背景 SuperSQL是一款自研的跨数据源、跨数据中心、跨执行引擎的高性能大数据SQL中间件，满足对位于不同数据中心的不同类型数据源的数据联合分析/即时查询的需求。SuperSQL的目标是成为公司内部统一的SQL分析中间件，实现以下三点的价值：解决业务数据孤岛，最大化数据的使用价值执行引擎最优选择，提升业务使用数据效率优化

SuperSQL：跨数据源、跨DC、跨执行引擎的高性能大数据SQL中间件

010

都是 HBase 上的 SQL 引擎，Kylin 和 Phoenix 有什么不同？

大数据时代，数据的价值越来越被重视，企业从海量大数据中挖掘所需要的信息，用来驱动业务决策以获得更大的商业价值。

《大型网站技术架构》读书笔记四：瞬时响应之网站的高性能架构

此篇已收录至《大型网站技术架构》读书笔记系列目录贴，点击访问该目录可获取更多内容。

ElasticSearch 双数据中心建设在新网银行的实践

本文公众号读者飞熊的投稿，本文主要讲述了ElasticSearch 双数据中心建设在新网银行的实践。

千万级数据查询：CK和ES选哪个？

在开发中遇到一个业务诉求，需要在千万量级的底池数据中筛选出不超过 10W 的数据，并根据配置的权重规则进行排序、打散（如同一个类目下的商品数据不能连续出现 3 次）。下面对该业务诉求的实现，设计思路和方案优化进行介绍。

Cloudera Labs中的Phoenix

Cloudera Labs在2016-06-27宣布打包了Apache Phoenix项目，版本为4.7.0，并基于CDH5.7.0。安装依旧是大家熟悉的Parcel方式，下载地址为：http://archive.cloudera.com/cloudera-labs/phoenix/parcels/1.3/

HBase实战 | HBase在人工智能场景的使用

近几年来，人工智能逐渐火热起来，特别是和大数据一起结合使用。人工智能的主要场景又包括图像能力、语音能力、自然语言处理能力和用户画像能力等等。这些场景我们都需要处理海量的数据，处理完的数据一般都需要存储起来，这些数据的特点主要有如下几点：

存储系统又慢又杂太难用？我们推荐这几本书帮你解决问题

我们常用的存储系统种类非常多，有单机的也有分布式的，有的是数据库，有的是文件系统，还有介于二者之间的。无论是哪种存储系统（比如，MySQL、Redis、Elasticsearch，等等），它们都具有如下三个特点。

大数据分析查询引擎Impala

准实时分析系统Impala，提供SQL语义，能够为存储在Hadoop的HDFS和Hbase中的PB级大数据提供快速、交互式的SQL查询。传统仓库查询工具Hive底层是基于MapReduce引擎处理，是一个批处理过程，难以满足快速响应的查询，而Impala是基于MPP的查询系统，最大特点就是快速。

CK、ES、RediSearch 对比，谁的性能更胜一筹

点击上方蓝色字体，选择“设为星标” 回复”学习资料“获取学习宝典文章来源：https://c1n.cn/EmgJv 目录前言初版设计方案 CK 分页查询使用ES Scroll Scan 优化深翻页 ES+Hbase 组合查询方案 RediSearch+RedisJSON 优化方案总结前言在开发中遇到一个业务诉求，需要在千万量级的底池数据中筛选出不超过 10W 的数据，并根据配置的权重规则进行排序、打散（如同一个类目下的商品数据不能连续出现 3 次）。下面对该业务诉求的实现，设计思路和方案优

Apache Kudu 对频繁更新数据场景下的大数据实时分析最佳用例

由于最近两次在大数据项目中使用Apache Kudu,写一篇文章谈谈对Kudu的一些看法和使用心得。

高并发风控技术解密（下）

•从业务中抽象及通用——如果一种业务有可能在今后重复出现，那就将其模块化，系统化（如批处理系统），发展成为平台能力

几种分布式调用链监控组件的实践与比较（一）实践

引言：最近在调研与选型分布式调用链监控组件。选了主要的三种APM组件进行了实践与比较。本来打算一篇文章写完的，篇幅太长，所以分了两篇。本文主要讲下链路traceing的基本概念和几种APM组件的实践，实践部分也没给出特别详细的步骤，因为本文重点不在具体的步骤。第二篇将会讲下几种APM选型的比较与性能测试。 1. 问题背景微服务架构下，服务按照不同的维度进行拆分，一次请求请求往往需要涉及到多个服务。互联网应用构建在不同的软件模块集上，这些软件模块，有可能是由不同的团队开发、可能使用不同的编程语言来实现、有可

高并发风控技术解密（下）

如何灵活高效的接入？平台化 •搭建平台而不是搭建项目——做一个“淘宝”而不是做只针对某几项业务的网站 •从业务中抽象及通用——如果一种业务有可能在今后重复出现，那就将其模块化，系统化（如批处理系统），发展成为平台能力动态化 •流程动态化——不同的业务类型对应的流程可以随意调整，无须调整代码 •代码动态化——采用groovy脚本动态调整线上代码，无须发版；规则配置除了使用各种灵活预配置外，还可以使用groovy脚本代码化规则；指标函数groovy化，不需要每次发版。 •配置动态化——配

phoenix二级索引

二级索引二级索引是从主键访问数据的正交方式。Hbase中有一个按照字典排序的主键Rowkey作为单一的索引。不按照Rowkey去读取记录都要遍历整张表，然后按照你指定的过滤条件过滤。通过二级索引，索引的列或表达式形成一个备用行键，以允许沿着这个新轴进行点查找和范围扫描。 1 覆盖索引（Covered Indexes） Phoenix特别强大，因为它提供了覆盖索引。一旦找到索引的条目，不需要返回主表。相反，把我么关心的数据绑定到索引行，节省了读取的时间开销。例如，以下内容将在v1和v2列上创建一个

TiDB 在威锐达 WindRDS 远程诊断及运维中心的应用

西安锐益达风电技术有限公司成立于 2012 年 1 月 4 日，是一家专业化的工业测量仪器系统、机电产品和计算机软件研发、设计和制造公司，是北京威锐达测控系统有限公司在西安成立的全资子公司。依托大学的科研实力，矢志不渝地从事仪器仪表及测量系统的研究和应用开发，积累了丰富的专业知识和实践经验，具备自主开发高端仪器系统和工程实施的完整技术能力。

010

《从零开始学架构》笔记——第四部分：架构实战

“不识庐山真面目，只缘身在此山中”，跳出技术的范畴，用业务发展的角度去审视技术，答案就会非常清晰。

ES性能优化实战，几十亿数据查询 3 秒返回！

原文链接：https://www.cnblogs.com/mikevictor07/p/10006553.html

Elasticsearch 亿级数据检索案例与原理

原文链接：https://www.cnblogs.com/mikevictor07/p/10006553.html

Elasticsearch 亿级数据检索性能优化案例实战！

https://www.cnblogs.com/mikevictor07/p/10006553.html

ElasticSearch 亿级数据检索深度优化

数据平台已迭代三个版本，从头开始遇到很多常见的难题，终于有片段时间整理一些已完善的文档，在此分享以供所需朋友的实现参考，少走些弯路，在此篇幅中偏重于ES的优化，关于HBase，Hadoop的设计优化估计有很多文章可以参考，不再赘述。

ElasticSearch 亿级数据检索深度性能优化

厉害了，ES 如何做到几十亿数据检索 3 秒返回！

数据平台已迭代三个版本，从头开始遇到很多常见的难题，终于有片段时间整理一些已完善的文档，在此分享以供所需朋友的

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐