首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Hive优化器原理与源码解析系列--统计信息中间结果大小计算

Hive在估算每个Operator的返回结果RowCount,即中间结果大小,有的是使用元数据对象来进行估算的RowCount;有的使用RelNode自身实现方法估算的;有的是总行数乘以其选择率估算的等多种方法实现...一个Operator返回记录数RowCount,即中间结果的大小直接影响到CostModel成本的大小(返回的RowCount是成本模型Cost Model的记录数、IO、CPU元素之一)。...+= partialRowCount; } return rowCount; } 2) 计算Project的RowCount Project投影,类似指定需要返回的字段列表组成记录,...offset非空的情况下,Sort的RowCount = min(总rowCount,offset + limit),否则用总记录数作为返回值。...()); if (rowCount !

81830
领券