是否有配置单元查询可以快速查找表大小(即行数),而无需启动耗时的MapReduce作业?(这就是我为什么要避免使用COUNT(*)
的原因。)
我尝试了DESCRIBE EXTENDED
,但得到的numRows=0
显然是不正确的。
(对于新问题,我深表歉意。我尝试用谷歌搜索和搜索apache.org文档,但没有成功。)
发布于 2016-03-21 21:00:03
tblproperties将给出表的大小,如果需要,可以用它来获取该值。
-- gives all properties
show tblproperties yourTableName
-- show just the raw data size
show tblproperties yourTableName("rawDataSize")
发布于 2017-03-31 21:43:16
如何使用:
hdfs dfs -du -s -h /path/to/table/name
发布于 2018-05-14 23:09:49
解决方案,尽管不是很快
如果表是分区的,我们可以计算分区的数量和每个分区的计数(行数)。
例如:,如果分区按日期(mm-dd-yyyy)
select partition_date, count(*) from <table_name> where <partion_column_name> >= '05-14-2018' group by <partion_column_name>
https://stackoverflow.com/questions/21208574
复制相似问题