温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
本节课我们来讨论一下hive的分区表。Hive支持创建分区表。当在表上创建分区后,每一个分区将对应于HDFS的一个目录。注意,分区是一个物理概念,表中的数据会按照分区的条件被分割进行存储。例如,我们在这里的表上创建了三个分区,它们分别是分区0、分区1和分区2。当创建分区时,需要指定分区条件,分区0中存储10号部门的员工,分区1中存储20号和30号部门的员工,分区2则存储40号部门的员工。当要查询20号部门的员工信息时,此时只会扫描分区1中的数据。通过这样的方式来避免全表扫描,从而提高查询的效率。在Hive中创建分区表时,可以通过使用关键字partition by来指定分区列的信息,分区列可以是表中的一个列,也可以是表中多个列的组合。例如,在这里的示例中使用了部门号作为了分区列,而have的分区表又可以被。
01:00
子划分成两种不同的类型,一种是静态分区表,另一种是动态分区表。那你知道这两种have的分区表如何使用吗?欢迎评论区留言讨论好了记得点加号关注赵玉强老师。
我来说两句