我在redshift DC28XL集群中有一个表,大约有527M行。
我添加了特定的varchar列(称为segment)作为dist键和排序键。每个片段大约有4M行。当我使用where子句对一个段运行简单的select时,select * from table where segment ='s1'; Redshift总是执行顺序扫描,并且需要3分钟以上的时间。有没有人可以帮助我避免全表扫描,并
我在Hbase上用phoenix做了两张桌子。在ORIGIN_LOG中,关键是info_key。然后使用info_key,我们可以通过info_key从ORIGIN_LOG获取详细的日志信息,因为info_key是ORIGIN_LOG的关键。
但是当我们解释下面的sql时。我们发现在ORIGIN_LOG上进行全面扫描将会花费很大的成本。from "ORIGIN_LOG" where "log_t&q