前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Hive窗口函数

Hive窗口函数

作者头像
十里桃花舞丶
发布2022-05-10 12:54:15
3260
发布2022-05-10 12:54:15
举报
文章被收录于专栏:桥路_大数据桥路_大数据

窗口函数

什么是窗口函数?

Hive的窗口函数over( ),可以更加灵活的对一定范围内的数据进行操作和分析。

它和Group By不同,Group By对分组范围内的数据进行聚合统计,得到当前分组的一条结果,而窗口函数则是对每条数据进行处理时,都会展开一个窗口范围,分析后(聚合、筛选)得到一条对应结果。

所以Group By结果数等于分组数,而窗口函数结果数等于数据总数。

如图所示,对省份进行Group By操作,每个省份下会有多条记录,然后对当前省份分组下的薪水做求和操作,得到的是3条结果。

img
img

而对相同的数据做窗口操作,则是在对每一条数据进行处理时,展开一个窗口,窗口中除了当前要处理的数据,还包含其它数据部分。这个窗口默认是全部数据,也可以规定窗口长度,如设定窗口与Group By一样,圈定当前省份下的数据。因为对当前数据处理时,可以参考窗口范围内的更多数据,所以在分析上更为灵活。既可以为每条数据增加一列,存放当前省份的薪水总和,也可以计算这条数据在当前省份中的薪水排名。

img
img

窗口函数over可以使用partition by、rows between … and …、range between … and …子句进

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2021-08-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 窗口函数
    • 什么是窗口函数?
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档