hbase 数据统计 - 腾讯云开发者社区

、、

我有一些域数据，例如，页面等，在hbase表中。我必须实时显示其统计数据，例如，每周的文档数量、无效/有效文档等。为此，我正在考虑为这些统计数据创建另一个Hbase表。MR作业将在处理原始表之后为新的周统计信息更新此新表。现在，我的新表的模式应该是什么。这是正确的方法吗？我必须实时可视化前100个域(需要一些排序)。此外，还预计数据将随着时间的推移而增长。

浏览 23提问于2019-09-30得票数 1

回答已采纳

1回答

火花流:源HBase

、、、

是否可能有火花流作业设置来跟踪HBase表并读取每批新的/更新的行？博客说HDFS文件属于受支持的源代码。但是他们似乎使用了以下静态API：谢谢!

浏览 4提问于2016-12-08得票数 2

2回答

如何计算hbase中单个行的大小？

我正在试图计算HBase中单个行的大小。我还没有找到一种在线或通过任何hbase实用程序来实现该功能的方法，我还使用hbase hfile -mbsf来查找Hfile的平均行大小和其他统计数据，但是我对一行的大小很好奇。有人找到办法了吗？

浏览 8提问于2015-06-10得票数 3

回答已采纳

1回答

当数据驻留在HDFS(HFile)上时，HFile读取的性能如何？

如我们所知，当内存存储中的数据达到阈值时，内存存储中的数据将作为HFile被刷新到HDFS。当我想通过行键获取数据，但数据在HDFS上时，HBase如何保证检索速度(或随机访问速度)？

浏览 2提问于2019-06-10得票数 1

回答已采纳

1回答

无法使用MapReduce向Hbase表插入数据

、、、

我已经编写了一个map reduce作业来从文件中读取数据并将其插入到Hbase表中。但我面临的问题是，只有1条记录被插入到Hbase表中。6941450当我将reducer输出写到一个文件中时，我得到的output.But不在Hbase

浏览 2提问于2015-06-18得票数 1

2回答

是否可以使用Loadrunner对Hbase表进行负载测试？

、、

我想负载测试新配置的hbase表，从各种其他系统获取数据。我正在寻找一个工具，可以帮助获得统计数据(响应时间等)。我能用Loadrunner做同样的事情吗？我想知道它是否支持，因为我在Loadrunner上看不到任何与hbase相关的协议。

浏览 1提问于2017-08-17得票数 0

1回答

如何在缺少计算机的工厂中发挥hbase+hadoop的优势

、

我是hbase和hdaoop的新手，最近我们想为一家工厂建立实时数据显示应用程序。元数据是从已经在使用中的其他应用程序收集的。我们应该对数据进行分析，做一些统计，以便为客户提供一些图表视图。但是，如果工厂没有足够的计算机来设置hbase+hadoop集群，而我的团队希望通过这种情况开始学习和使用hbase+hadoop为未来的应用程序做好准备。谢谢你的建议。

浏览 0提问于2013-04-09得票数 0

2回答

我需要在HBase和HDFS之上使用SolrCloud作为搜索引擎，以搜索大量文档。目前，这些文档位于不同的数据源中。我搞不懂Solr是应该在自己内部搜索、索引和存储这些文档，还是应该只使用Solr来索引，并且文档及其元数据应该驻留在HBAse/HDFS层中。我尝试过搜索Solr集成是如何工作得最好的(意思是应该在HBase级别做什么，在Hadoop级别做什么)，但都是徒劳的。有没有人之前做过这种大数据搜索，可以给出一些建议？谢谢

浏览 3提问于2015-08-07得票数 1

1回答

有没有好的java库来捕获作业统计数据？

、、

我们正在构建一个在大数据上运行多个并行作业的产品。对一个好的java库有什么建议吗?它可以帮助我们测量/封装每个作业的统计数据，并聚合统计数据-比如时间/内存/资源使用情况？此外，有没有好的java库可以很好地与hadoop / hbase / yarn等框架集成，以捕获与特定作业相关的框架特定统计数据？

浏览 0提问于2014-01-06得票数 1

1回答

如何修改- echo stats | nc <ip> <port>的输出

、、

while :; do sleep $COLLECTION_INTERVAL输出：tsd.hbase.rpcs 1389058717 0 type=rowLock host=xtsd.hbase.rpcs

浏览 2提问于2014-01-07得票数 0

1回答

Apache Hadoop中的组合器函数与Gora

、、、、

我有一个简单的Hadoop，Nutch 2.x，Hbase集群。我必须写一个MR作业，这将找到一些统计数据。这是两个步骤的工作，即，我认为我也需要组合器功能。我的统计数据将被添加到Hbase的页面中，这就是为什么我不能关于Gora (我想)。

浏览 5提问于2019-01-02得票数 3

1回答

PIG HBASE失败；存储CSV

、、

我从Hadoop、HBase、Pig环境开始；我将在Hbase表上存储一个数据库；以下是我的请求：HadoopVersion PigVersionhduser / data.csv“读取数据输出:未能在"hbas

浏览 0提问于2013-07-23得票数 1

回答已采纳

3回答

是否建议使用NoSQL上的文件I/O -尤其是HBase？还是不想？

、、、

我会将文件以二进制形式存储在HBase中。是推荐的吗？我担心I/O速度。我之所以使用Hadoop作为存储，是因为我必须使用，但我不能在客户端计算机上构建HBase。正因为如此，我尝试寻找一些库来帮助客户端连接到HDFS来获取文件。但是我找不到它，所以我选择了HBase而不是连接库。在这种情况下，我该怎么办？

浏览 1提问于2011-07-21得票数 1

1回答

Hbase for File I/O以及在远程客户端上连接HDFS的方法

、、、

我是NoSQL的新手，现在正在尝试使用HBase进行文件存储。-我会将文件以二进制形式存储在HBase中。我不需要任何统计数据。我唯一需要的是文件存储。是推荐的吗！？！？我能从别人那里得到任何帮助吗？

浏览 1提问于2011-07-22得票数 0

回答已采纳

1回答

GeoMesa -支持的数据存储之间的差异？

、、

我正在浏览，目录公开了许多可使用的受支持的数据存储： Accumulo数据存储卡夫卡数据存储HBase数据存储Bigtable数据存储卡桑德拉数据存储我找不到实现级别的比较(例如在支持&#

浏览 4提问于2017-03-15得票数 2

回答已采纳

1回答

MAPREDUCE -将数据批量加载到HBASE表中

、、、

为什么我们只使用driver类和mapper类，而不使用reducer类？

浏览 9提问于2017-01-15得票数 1

回答已采纳

1回答

如何从另一个Hbase表中加入Hbase表？

、、

所有人我有两个集群，A组的Hbase有员工表，B组的Hbase有部门表。我需要安装蜂巢吗？

浏览 4提问于2016-03-28得票数 1

回答已采纳

1回答

HBase表的大小比hadoop中的文件大得多。

、、

最近，我使用hadoop批量加载将数据放入hbase中，首先，我调用hdfs将数据写入hadoop中的文件中，总共有7,000,000行数据，大小为503 to。其次，我使用org.apache.hadoop.hbase.mapreduce.ImportTsv和org.apache.hadoop.hbase.mapreduce.LoadIncrementalHFiles将数据放入hbase中。我所做的最重要的事情是使用大容量工具将数据

浏览 5提问于2012-12-13得票数 3

2回答

时序数据的ElasticSearch

我正在评估一些不同的NoSQL数据库来存储时间序列JSON数据。由于查询引擎，ElasticSearch变得非常有趣，我只是不知道它是否适合存储时间序列数据。数据由以不同时间间隔从设备收集的各种指标和统计数据组成。每段数据都是一个JSON对象。我希望每天收集大约12 in的数据，但只需要将数据保存在ES中180天。与MongoDB或Hbase相比，ElasticSearch是否适合这些数据？

浏览 3提问于2014-07-22得票数 7

回答已采纳

5回答

如何监测hbase的主要压实度

、

我要监测hbase的主要压实情况。每一张桌子我都想知道通过UI？

浏览 4提问于2012-11-13得票数 7

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

实时时间序列新表的Hbase模式设计

火花流:源HBase

如何计算hbase中单个行的大小？

当数据驻留在HDFS(HFile)上时，HFile读取的性能如何？

无法使用MapReduce向Hbase表插入数据

是否可以使用Loadrunner对Hbase表进行负载测试？

如何在缺少计算机的工厂中发挥hbase+hadoop的优势

Solr HBase搜索引擎

有没有好的java库来捕获作业统计数据？

如何修改- echo stats | nc <ip> <port>的输出

Apache Hadoop中的组合器函数与Gora

PIG HBASE失败；存储CSV

是否建议使用NoSQL上的文件I/O -尤其是HBase？还是不想？

Hbase for File I/O以及在远程客户端上连接HDFS的方法

GeoMesa -支持的数据存储之间的差异？

MAPREDUCE -将数据批量加载到HBASE表中

如何从另一个Hbase表中加入Hbase表？

HBase表的大小比hadoop中的文件大得多。

时序数据的ElasticSearch

如何监测hbase的主要压实度

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐