首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >Spark SQL -查找每年一个月的最大值

Spark SQL -查找每年一个月的最大值
EN

Stack Overflow用户
提问于 2020-10-04 01:23:38
回答 2查看 77关注 0票数 1

我已经创建了一个包含年、月和事件发生次数(计数)的数据框架。

我想使用spark SQL找出每年发生事件最多的月份。

EN

回答 2

Stack Overflow用户

发布于 2020-10-04 01:24:41

如果要使用SQL,可以使用窗口函数:

代码语言:javascript
运行
复制
select t.*
from (select t.*,
             row_number() over (partition by year order by count desc) as seqnum
      from t
     ) t
where seqnum = 1;

这将每年返回一行,即使存在最大计数的平局。如果您希望在平局情况下使用所有这些行,则使用rank()而不是row_number()

票数 0
EN

Stack Overflow用户

发布于 2020-10-04 01:25:07

您可以使用窗口函数:

代码语言:javascript
运行
复制
select *
from (select t.*, rank() over(partition by year order by cnt desc) rn from mytable t) t
where rn = 1

对于每一年,这将为您提供具有最大cnt的行。如果存在关联,则查询将返回它们。

注意,count是SQL中的一种语言关键字,因此不是列名的好选择。在查询中,我将其重命名为cnt

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/64186980

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档