腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
Apache
Spark
SQL
:
如何
使用
GroupBy
和
Max
过滤
数据
我有一个给定的
数据
集,结构如下: https://i.imgur.com/Kk7I1S1.png 我需要
使用
SparkSQL解决以下问题: 对于每个邮政编码,找出以前发生事故次数最多的客户。
浏览 27
提问于2019-06-07
得票数 0
回答已采纳
4
回答
在Java
Spark
Dataframe API (1.4.1)中未定义的
max
()
和
sum()方法
、
、
将DataFrame.
groupBy
()的示例代码放入我的代码中,但它显示
max
()
和
sum()的方法未定义。df.
groupBy
("department").agg(
max
("age"), sum("expense")); 如果我想
使用
max
()
和
sum()方法,我应该导入哪个Java包?
浏览 1
提问于2015-09-08
得票数 8
2
回答
习语Scala在星火中的应用
、
、
我有下面的表达, s""" | proposal, |
MAX
(page_view_after) AS page_view_after |""".stri
浏览 1
提问于2020-05-24
得票数 0
回答已采纳
1
回答
如何
计算非双型星火统计量?
、
、
、
spark
包括用于计算min、
max
和
类型"double“值的平均统计信息的工具,但是在尝试处理float类型的列值时,
如何
处理
spark
/java/cassandra场景?编辑了以显示分辨率:import static org.
apache
.
spark
.
sql
.functions.*;
浏览 0
提问于2016-02-08
得票数 1
6
回答
如何
为
数据
文件中的每一列计算每个不同值的出现量?
、
是否有一种有效的方法也可以显示这些不同值在
数据
帧中发生的次数?(计算每个不同的值)
浏览 15
提问于2016-06-21
得票数 38
回答已采纳
3
回答
如何
计算相同元素在列中的值
、
我有个
数据
:| id| column1| column2|| 2| 6| 5|
如何
求出第以及
如何
求出列2中的值之和?
浏览 2
提问于2020-05-06
得票数 0
回答已采纳
3
回答
pyspark列不可迭代
、
当我尝试
groupBy
并获取最大值时,有了这个
数据
帧I正在获取列是不可迭代的:+---+-----++---+-----+ 65 linesWithSparkDF.show(10)---> 67 linesWithSparkGDF = linesWithSparkDF.
groupBy
(col("id")).agg(
max
(col("cycle")))
浏览 4
提问于2016-04-29
得票数 23
回答已采纳
3
回答
在Scala中查找
数据
帧中数组列的重复值
、
、
我有一个包含数组列的
数据
帧,如下所示: val df = Seq( Array("bcd", "bc", "bcd]['abc'] ['bcd
浏览 43
提问于2020-04-02
得票数 0
回答已采纳
1
回答
使用
scala在
spark
-
sql
中按其他列检索最大日期分组
、
、
已将
数据
帧注册为临时视图。我
使用
spark
提供的
sql
方法运行以下
sql
语句。val maxDateDF =
spark
.
sql
("SELECT name,
max
(birthDate) maxDate FROM people group by name") imp
浏览 22
提问于2021-03-10
得票数 0
回答已采纳
6
回答
Apache
:获取每个分区的记录数
、
、
、
、
我想检查一下
如何
才能得到关于每个分区的信息,比如总no。在以部署模式提交
Spark
作业时,驱动端每个分区中的记录作为纱线集群提交,以便在控制台上记录或打印。
浏览 15
提问于2017-09-04
得票数 22
回答已采纳
2
回答
如何
获取列的最小值
和
最大值?
、
、
目标是在DataFrame df中计算字段minTimestamp的最小值
和
字段maxTimestamp的最大值,并删除所有其他值。1530809940val cw_min = Window.partitionBy($"src", $"dst").orderBy($"minTimestamp".asc) val cw_
max
"rn", row_number.over(cw_min)).where($"rn" === 1).drop("
浏览 46
提问于2018-07-06
得票数 1
回答已采纳
1
回答
使用
java通过
spark
从cassandra表中获取最新记录
、
、
数据
类型。我想要类似的输出
使用
java。(yesterdayDate)).
groupBy
("mobileno").
max
("edate"); 但是我得到了这个错误: org.
apache
.
spark
.
sql
.AnalysisExceptionAggregation function can only be applied on a numeric column.; at org.
apache
.
spark<
浏览 65
提问于2019-02-22
得票数 0
1
回答
有没有更好的方法来适当地修剪我的
spark
DataFrame呢?
、
、
|1 ||query8|13|3 |+------+--+-----+ 如果变量number是2,我想得到下面的
数据
帧其次,我
使用
迭代器遍历列表,并
使用
df.select($"eachColumnName"...).where("query".equalTo(iter.next())).将
数据
帧裁剪为列表中的当前查询然后是.limit(howMany),然后是
groupBy
($&
浏览 20
提问于2019-02-08
得票数 0
回答已采纳
7
回答
从特定的列scala星星之火
数据
获取min
和
max
、
、
、
我想从dataframe访问特定列的min
和
max
,但是我没有该列的标题,只有它的编号,所以我应该
使用
scala吗?
浏览 10
提问于2017-04-05
得票数 35
回答已采纳
1
回答
时间戳中的火花查找空白
、
、
读取
数据
时,条目按时间戳排序,因此RDD的每个分区都应按时间戳排序。我想做的是,找到每一个键,最大的差距之间的2个顺序时间戳。我已经思考这个问题很长时间了,我看不出这是
如何
实现的,考虑到火花提供的功能。我看到的问题是:当我做一个简单的地图时,我会丢失订单信息,所以这是不可能的。任何关于
如何
处理这个问题的帮助都会非常有帮助。
浏览 1
提问于2016-10-09
得票数 0
回答已采纳
4
回答
如何
使用
collect作为key,col作为value,以map的形式收集
spark
数据
帧
在我的完整
数据
中有数百列,所以手动转换每一列是不可行的。scala> import
spark
.implicits._import org.
apache
.
spark
.
sql
.functions._ scala> val df = Seq((1,3)
浏览 49
提问于2020-06-12
得票数 0
回答已采纳
2
回答
连接两个
数据
文件,将值加起来并得到最大值。
、
我有两个.txt
数据
文件。第一列包含两列(电影、电影院),第二列也包含两列(电影、观众),如下面的示例所示。我想要做的是,在cinema_1 中找到观众人数最多的电影。。|| movie_3 | 31 |例如,在上面的示例中,两个候选对象是movie_3
和
movie我到目前为止所做的事: val moviesCinemas = sparkSession.read .format("c
浏览 0
提问于2017-02-18
得票数 0
回答已采纳
1
回答
Spark
dataframe筛选器最小值(列)失败
、
、
我正在
使用
hadoop 3.0.0
和
spark
2.2.0中的以下scala代码处理
数据
帧。BAQ是ID列,AAA是日期YYMMDD的字符串列。|
groupBy
("BAQ").agg("AAA"->"min"); dtfAbnoFirs: org.
apache
.
spark
.
sql
.DataFrame = [BAQ: string| join(dtfAbnoFirs,Seq(&q
浏览 34
提问于2021-04-08
得票数 0
回答已采纳
2
回答
星星之火2.0
groupBy
列,然后在datetype列上获得最大值(日期)
、
、
我正在Java中
使用
Spark
2.0。我有一个
数据
集,如下所示: ID|col1|col2|col3| date|968800| 2010-12-31|我试过了 Dataset<Row> df = old_df.
groupBy
("ID").
max
("dat
浏览 7
提问于2016-09-26
得票数 2
回答已采纳
3
回答
如何
设置最大值并保留所有列(针对每个组的最大记录)?
、
| 63|| a|pref1| e| 84|+----+-----+---+-----++----+-----+---+----------++----+-----+---+----------+| a|pref2| z| 105| +----+-----+---+----------+
浏览 0
提问于2017-03-07
得票数 13
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
云直播
活动推荐
运营活动
广告
关闭
领券