如何降低全表扫描对Hbase集群的影响？

、

有没有可能限制糟糕的查询对Hbase集群的影响？我是否需要kerberos来识别用户并限制其查询的影响，或者为他们分配资源？来自phoenix的糟糕的查询可能会杀死整个Hbase集群，这是我真的想要改变的。我将非常感谢在这个主题中的任何提示。

浏览 23提问于2016-09-24得票数 2

2回答

存储海量数据和实时更新的非HBase解决方案

、、、、

所有三个步骤都运行良好，但当我将应用程序部署到共享集群的生产服务器上时，基础设施团队不允许我们运行我的应用程序，因为我在HBase上做了完整的表扫描。我使用了94个节点集群，我拥有的最大的HBase表数据大约有20亿.All，其他表的数据量还不到数百万。 mapreduce扫描和创建文本文件的总时间需要2小时。我还集成了

浏览 3提问于2017-05-20得票数 2

回答已采纳

1回答

使用时间范围的HBase表扫描可以避免全表扫描吗？

对HBase表的扫描操作可以与时间范围一起完成。(参考：)使用时间范围进行的HBase扫描可以避免全表扫描吗？

浏览 2提问于2014-11-26得票数 0

2回答

RowKey中对通配符的HBase支持

我想知道在RowKey扫描中HBase是否支持通配符。类似于：我知道，如果我们对行键的前缀有一定的了解，我们就可以使用部分键扫描( HBase对这种扫描非常有效但是，如果我们没有信息前缀(这意味着搜索键可能在RowKey中的任何位置)，那么Hbase必须运行全

浏览 2提问于2013-04-25得票数 4

1回答

为基于位置的条目设计HBase表(模式)

在为基于位置的条目设计HBase表(架构)时需要一些要点或建议，即按以下方式获取数据2. Country4. Cities 5.

浏览 1提问于2018-02-15得票数 0

回答已采纳

1回答

在HBase中，startrow和stoprow的使用如何不会导致全表扫描？

、

这是因为Rowkey Prefix Filter会导致行键的全表扫描，而通过startrow和stoprow进行的范围扫描不会导致全表扫描。为什么不呢？无论如何，通过startrow和stoprow进行范围扫描如何不会导致行键的全表扫描？以python中的这个小例子为例，说明为什么我不理解行键

浏览 4提问于2016-10-22得票数 3

回答已采纳

1回答

为什么HBase的全扫描和聚集速度比拼板慢，尽管它也是柱状数据库？

、、、、

我一直试图在360度的客户应用程序中使用“正确”技术，它需要：我们在几个专栏中更新客户的信息，每天有100万行<=。更新工作负载分布在各个工作时间。我们有两亿多行。我试过使用Hbase，第1点和第3点都满足了。但是我发现在HBase上进行分析(加载/保存/聚合)非常慢，比使用Parque

浏览 0提问于2018-07-16得票数 1

回答已采纳

2回答

在Hbase中禁用用于大型扫描的块缓存

我一直在读关于我应该在Hbase中禁用块缓存以进行大扫描的文章。我认为如果我不使用块缓存，我应该赢得时间，因为GC不必如此频繁地执行。我也从Cloudera那里发现了一个关于这个问题的问题，我真的不喜欢这个测试题的任何可能的回答，我想这应该是事实。那么，如果您禁用了块缓存，您是否可以获得更好的大型(全表)扫描性能？原因何在？

浏览 0提问于2014-04-10得票数 2

1回答

将HDFS复制因子降低到2(或仅1)对HBase映射/降低性能的影响

、、、、

将HDFS复制因子降低到2(或仅1)对HBase映射/降低性能有什么影响？我在Azure上托管了一个HBase集群，其数据存储在azure托管磁盘中。Azure托管磁盘本身保存了3份数据副本以进行容错，因此考虑降低HDFS复制因子以节省存储开销。考虑到地图减少作业利用数据的本地可用性来避免通过网络进行数据传输，如果只有一个可用数据的副本，那么想知道有谁有关于地图降低性能的

浏览 0提问于2019-02-10得票数 1

3回答

即使使用where子句中使用的排序关键字，Redshift也会执行全表扫描

我在redshift DC28XL集群中有一个表，大约有527M行。我添加了特定的varchar列(称为segment)作为dist键和排序键。每个片段大约有4M行。当我使用where子句对一个段运行简单的select时，select * from table where segment ='s1'; Redshift总是执行顺序扫描，并且需要3分钟以上的时间。有没有人可以帮助我避免全表扫描，并

浏览 0提问于2019-01-09得票数 0

1回答

行上的TTL和HBase中的事件触发

我想知道在HBase (或任何类似的DB)中有没有什么功能可以让我为每一行设置TTL，然后HBase给我一个事件(用java编写)，让我在该行到期时编写一些过程？

浏览 1提问于2016-12-14得票数 0

1回答

我在Hbase上用phoenix做了两张桌子。在ORIGIN_LOG中，关键是info_key。然后使用info_key，我们可以通过info_key从ORIGIN_LOG获取详细的日志信息，因为info_key是ORIGIN_LOG的关键。但是当我们解释下面的sql时。我们发现在ORIGIN_LOG上进行全面扫描将会花费很大的成本。from "ORIGIN_LOG" where "log_t&q

浏览 3提问于2015-02-15得票数 2

1回答

HBase FuzzyRowFilter忽略扫描开始/停止行

、

在基于Cloudera的HBase部署上运行一些测试代码时，我遇到了这个奇怪的问题。这就是它变得有趣的地方，我在我的PC上安装了一个独立的伪分布式HBase v2.0.4，在这个设置中，它按预期工作！唯一的区别是HBase版本和我的安装没有在集群上工作。所以我想找出为什么会这样，我有几个问题：我认为FuzzyRowFilter应该尊重开始停止行的假设是错误的

浏览 0提问于2019-04-06得票数 0

1回答

如何在Talend BigData Studio中访问基于区域的HBase表记录

、

我正在尝试从Talend BigData工作室访问基于区域的Hbase表记录。我们是否有任何选项来根据区域过滤tHBaseInput组件中的记录。还有，如何过滤tHBaseInput中的记录，以基于日期列过滤增量记录？

浏览 2提问于2017-04-18得票数 1

1回答

apache如何查询HBase？

、、、

当我们在Hbase列上启动SQL with condition时，hbase是否每次都会进行完全扫描？或者，drill使用了某种索引机制来避免完全扫描？

浏览 0提问于2018-03-22得票数 0

2回答

如何使用rest api从HBase中的列族中获取列名？

我正在尝试使用rest api在hbase中获取表的列名。网址：我只能获取列族名称("Info")。但是我需要获得表中的所有列名。请告诉我如何使用rest api获取它。提前谢谢。

浏览 1提问于2018-02-16得票数 1

1回答

AWS EMR:如何将数据从一个EMR迁移到另一个EMR

、

我目前有一个运行HBase的AWS EMR集群。我正在将数据保存到S3。我想将数据迁移到同一帐户上的新EMR集群。将数据从一个电子病历迁移到另一个电子病历的正确方法是什么？谢谢

浏览 1提问于2021-03-06得票数 0

1回答

Hbase ResultScanner.next()第一次响应需要很长时间

、、、

我是Hbase的新手，下面的问题可能看起来很傻！(我预先道歉:)我们在Hbase中创建了两个表，名为TableA和TableB。我们必须插入数据(从类型A或B)，并且我们有一个拉函数，它应该得到一行(A或B类型)，返回它并从表<

浏览 1提问于2015-09-15得票数 0

回答已采纳

1回答

如何使用python节俭客户端使用maxversion扫描hbase表？

、、

全def scannerOpenWithScan(self, tableName, scan, attributes) def scannerOpen(self, tableName, start

浏览 0提问于2012-11-27得票数 4

1回答

如何提高Oracle CBO对散列连接、按‘s和order by's的成本估算

、、、、

在我们有的服务器上，与实际成本相比，散列连接、按‘s分组和order’s的成本似乎太低了。也就是说，通常使用索引范围扫描的执行计划的性能优于前者，但在解释计划上，成本会更高。一些进一步的说明：，我已经将optimizer_index_cost_adj设置为20，但仍然不够好。我不想增加纯全表扫描的成本，实际上我不介意优化器降低成本。我注意到pga_aggregate_target对CBO成本估计产

浏览 3提问于2009-07-14得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

存储海量数据和实时更新的非HBase解决方案

使用时间范围的HBase表扫描可以避免全表扫描吗？

RowKey中对通配符的HBase支持

为基于位置的条目设计HBase表(模式)

在HBase中，startrow和stoprow的使用如何不会导致全表扫描？

为什么HBase的全扫描和聚集速度比拼板慢，尽管它也是柱状数据库？

在Hbase中禁用用于大型扫描的块缓存

将HDFS复制因子降低到2(或仅1)对HBase映射/降低性能的影响

即使使用where子句中使用的排序关键字，Redshift也会执行全表扫描

行上的TTL和HBase中的事件触发

在Hbase和phoenix上哪种sql更好？

HBase FuzzyRowFilter忽略扫描开始/停止行

如何在Talend BigData Studio中访问基于区域的HBase表记录

apache如何查询HBase？

如何使用rest api从HBase中的列族中获取列名？

AWS EMR:如何将数据从一个EMR迁移到另一个EMR

Hbase ResultScanner.next()第一次响应需要很长时间

如何使用python节俭客户端使用maxversion扫描hbase表？

如何提高Oracle CBO对散列连接、按‘s和order by's的成本估算

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐