HBase源码优化 - 腾讯云开发者社区

文章/答案/技术大牛

发布

1回答

在windows 10中启动hbase shell时出错

C:\hadoop-3.2.1\hbase\bin>hbase shell将ruby文件打包到jar中并使用jruby的引导来调用它们，从而取代了这个文件。如果您出于某种原因需要源码这个文件，它现在被命名为'jar-bootstrap.rb‘，位于文件hbase-shell.jar的根目录中，并位于源码树中的'hbase-shell/src/main/ruby

浏览 95提问于2021-01-14得票数 0

1回答

Beeline无法创建外部hbase表，但配置单元cli可以

、、

我有hbase 1.2.3集群，并安装了hive 2.1.1。当我尝试通过beeline/hiveserver2创建外部hbase表时，我得到了异常。但是如果我使用hive cli，它是可以的。create语句如下： stored by 'org.apache.hadoop.hive.hbase.HBaseStorageHandler' with serdepropert

浏览 5提问于2017-01-06得票数 0

1回答

运行MR代码将数据加载到HBASE中

、、

我是HBASE新手，我正尝试从HDFS将数据加载到HBASE中，但每次运行MR时都无法执行此操作所有的类文件都在那里我不知道哪里出了问题.To运行MR首先我编译了源码并将hadoop和hbase库包含在类路径中然后我生成了"hba

浏览 3提问于2012-02-27得票数 0

回答已采纳

2回答

如何使用flume从mysql中读取数据？

、、、

如何使用flume从mysql连续读取数据加载到hbase？我熟悉sqoop，但我需要从mysql源码中不断地使用它。是否需要自定义源才能做到这一点？

浏览 3提问于2012-10-02得票数 3

5回答

单节点上的hbase安装

、

现在，我正在尝试在其上安装hbase (0.94.18版)。但是我得到了以下错误(尽管我已经将其解压缩到/usr/local/hbase中)：

浏览 1提问于2014-05-11得票数 3

1回答

Hadoop context.write()缓冲区大小

、、、

我正在使用带有puts的context.write()从映射器写入HBase。根据这个，context.write()不会立即刷新，而是等待缓冲区填满，然后才将它们异步设置到服务器。目的是通过调整缓冲区大小来减少对HBase表的RPC调用。

浏览 6提问于2015-08-07得票数 0

2回答

是否有可能从hbase转换为spark rdd效率？

、、、

我在hbase中有一个很大的项目数据集，我想要加载到spark rdd中进行处理。我的理解是，hbase针对hadoop上的低延迟单项目搜索进行了优化，所以我想知道是否有可能在hbase中高效地查询1亿个项目(大约10TB大小)？

浏览 1提问于2017-10-25得票数 0

2回答

Cloudera 5.4.4群集-获取聚合使用指标

、、

我想从Cloudera5.4.4 Hadoop集群中收集聚合使用指标。我心目中的一些指标如下：提前感谢！

浏览 1提问于2015-09-03得票数 1

回答已采纳

1回答

为什么HBase的全扫描和聚集速度比拼板慢，尽管它也是柱状数据库？

、、、、

我试过使用Hbase，第1点和第3点都满足了。但是我发现在HBase上进行分析(加载/保存/聚合)非常慢，比使用Parquet慢10倍。我不明白为什么Parquet和Hbase都是柱状DBs，而且我们已经很好地分散了HBase集群中的工作负载(“每个区域的请求”这么说)。有什么建议吗？我是不是用错工具做这份工作了？

浏览 0提问于2018-07-16得票数 1

回答已采纳

1回答

上传到Hbase后数据大小减小

、、、

当文件作为记录从linux机器上传到Hbase表时，我们观察到数据大小的减少(文件系统上为10 GB，Hbase表中为6-8 GB )。在hbase表上没有使用压缩方法，主要压缩也被禁用。

浏览 47提问于2021-06-23得票数 0

1回答

在Spark的MLlib中使用TFIDF生成过程中的内存不足异常

、、、

为了给出一个规模概念，我从HBase中读取了大约61.5万个(约4GB的文本数据)小文档，并运行了带有8核和6GB执行器内存的spark程序。我已经尝试过增加并行级别和洗牌内存分数，但没有效果。

浏览 1提问于2014-09-18得票数 4

回答已采纳

1回答

我使用HBase来存储一些流数据，我有从一个插入到另一个插入的值，并且使用现有的值。我有一个这样创建的表： hbase(main):005:0> create ‘mytable’,’mycolfam’ 该表将包含一个名为val的字段首先，按原样插入数据(key=1、val=10)：hbase(main):005:0> put 'mytable','1','mycolfam:val',10 然后，我有了相同键'1‘的传入数据(key=1，val=12)，并且<

浏览 13提问于2019-04-02得票数 2

回答已采纳

1回答

谁执行HBase过滤器？

、、

哪台机器执行org.apache.hadoop.hbase.filter.Filter？因为过滤器是不能串行化的

浏览 0提问于2018-05-10得票数 3

回答已采纳

2回答

HBase作为web应用后端

、

有人能建议让HBase作为基于web的应用程序的主要数据源是否是个好主意吗？我主要关心的是HBase对查询的响应时间。有可能有亚秒级的反应吗？该应用程序将用于显示存储在HBase中的数据，例如在过去的24小时中关键字"X“发生了多少次。对于该应用程序80%的请求，我将知道确切的键，20%的请求是扫描(我正在研究与HBase模式设计相关的主题，以使其运行得更快)

浏览 0提问于2012-10-28得票数 3

1回答

我想要扫描大量的数据(基于范围的查询)，在编写数据时，我可以做什么优化，以便扫描变得更快？

、

我在hbase中有十亿行，我想一次扫描百万行。什么是最好的优化技术，我可以做，使这个扫描尽可能快。

浏览 4提问于2011-12-08得票数 3

回答已采纳

1回答

存储TimeStamp的最佳方法

、、、

然后，CSV文件将数据导出到MySQL和HBase数据库。我有大约2亿条记录(1TB)，因此我需要优化每个处理步骤。我应该使用什么数据类型来存储Python、CSV、MySQL和HBase数据库中的TimeStamp值？我需要存储TimeStamp值的所有方面。我的模式在CSV文件、MySQL和HBase数据库表中有4列。谢谢!

浏览 0提问于2015-03-10得票数 1

2回答

哪一个是最好的HBase连接器用于批量加载数据到HBase从火花？

、

正如在中也提到的，主要有两个选项：我对一个接一个的记录不感兴趣，而是对高吞吐量感兴趣。在深入研究代码之后，似乎两者都求助于TableOutputFormat、DataFrame库是否为大容量加载提供了与RDD库相比的性能改进

浏览 2提问于2017-11-08得票数 1

1回答

利用HADOOP的遥感图像数据

、

实际上，我对hadoop环境并不熟悉，而且遇到了很多困难。有人能帮忙完成以下任务吗？

浏览 0提问于2018-09-18得票数 1

3回答

HBase上的配置单元与HDFS上的配置单元

、、、

我的数据不需要实时加载，所以我不需要使用HBASE，但我想知道在MR Jobs中使用HBASE是否有任何性能优势，由于索引数据，连接不是应该更快吗？有人有什么基准吗？

浏览 1提问于2012-07-29得票数 2

回答已采纳

2回答

使用Hbase* shell手动拆分Hbase区域*

我们面对的是HBase区域的热点。所有写操作都被重定向到一个区域服务器，因此某些映射需要花费大量时间。我想手动拆分区域使用HBase外壳，但可以找到任何示例。拆分地域服务器最好的优化方式是什么？

浏览 0提问于2016-03-16得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在windows 10中启动hbase shell时出错

Beeline无法创建外部hbase表，但配置单元cli可以

运行MR代码将数据加载到HBASE中

如何使用flume从mysql中读取数据？

单节点上的hbase安装

Hadoop context.write()缓冲区大小

是否有可能从hbase转换为spark rdd效率？

Cloudera 5.4.4群集-获取聚合使用指标

为什么HBase的全扫描和聚集速度比拼板慢，尽管它也是柱状数据库？

上传到Hbase后数据大小减小

在Spark的MLlib中使用TFIDF生成过程中的内存不足异常

使用现有值在HBase中向上插入

谁执行HBase过滤器？

HBase作为web应用后端

我想要扫描大量的数据(基于范围的查询)，在编写数据时，我可以做什么优化，以便扫描变得更快？

存储TimeStamp的最佳方法

哪一个是最好的HBase连接器用于批量加载数据到HBase从火花？

利用HADOOP的遥感图像数据

HBase上的配置单元与HDFS上的配置单元

使用Hbase* shell手动拆分Hbase区域*

扫码

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐