腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
从
PySpark
中
Groupby
之后
的
另一
列
的
值
获取
最小值
和
最大值
、
、
在
pyspark
中
的
另外两个
列
中
执行了
groupby
之后
,我正在尝试
从
列
的
值
中
获取
最小值
和
最大值
。bra | hh | 3 |我目前
的
实现是
浏览 40
提问于2021-06-08
得票数 2
回答已采纳
1
回答
如何绘制不同日期
的
最大值
直方图?
、
、
、
、
我试图简单地绘制不同日期
的
最大值
的
直方图。我有一个包含许多
列
的
DataFrame,包括一个
列
date
和
一个
列
Points。首先,我用下面的代码找出每个日期
的
最大Points:然后我试着画出这些
最大值
的
直方图,我想要在y轴上有
浏览 0
提问于2018-12-01
得票数 1
1
回答
Pyspark
排序并
获取
第一个
和
最后一个
我使用下面的代码基于一
列
进行排序。我想知道如何
获取
排序数据帧
中
的
第一个元素
和
最后一个元素?
浏览 2
提问于2019-08-22
得票数 1
1
回答
如何在Scala SPARK中找到
groupBy
之后
的
agg()函数
中
的
分位数
、
、
、
、
我有一个数据帧,我想在其中
groupBy
列
A,然后找到不同
的
统计数据,如平均值,
最小值
,
最大值
,标准差
和
分位数。我可以使用以下代码找到
最小值
、
最大值
和平均值:df.
groupBy
("A").agg(min("B"), max("B"), mean("B")).show(50, false) 但是我找不到分位数(0.25我尝试了approxQuantile<
浏览 91
提问于2019-09-03
得票数 1
回答已采纳
1
回答
pyspark
将列名
从
列表传递到dataframe函数,如何插
值
?
、
、
、
、
我已经编辑了这个问题来提供一个例子-colnames = ['col1','col2','col3'] 我需要一个接一个地将它们传递给Dataframe函数,以返回每个函数
的
值
。我不会使用
groupBy
函数,因此这不是
另一
个问题
的
重复。我只需要Dataframe
中
每
列
所有
值
的
最大值
、
最小值
、
浏览 0
提问于2018-05-24
得票数 1
1
回答
大熊猫群
中
的
最小
和
最大排
、
我有一个熊猫
的
数据,我分组在‘组I’。每一行都有一个x
和
y坐标以及一个残差(距离线x=y
的
距离)。现在我想在一个群
中
求出2点(x,y)之间
的
梯度,其中残差是最大
的
和
最小
的
。我知道如何使用gb‘残留物’..min()
和
max(),但这并没有给出行。 我怎么算这个?
浏览 1
提问于2016-12-05
得票数 2
回答已采纳
2
回答
行
的
最小值
和
最大值
,而不是
列
、
在我
的
mysql表
的
同一行上,我有一个persons、value1、value2、value3、value4、value5。我想从
值
1-5
中
获得最低
的
值
,并将其放在
列
lowestvalue
中
。我知道如何
从
选定
的
列
中
获取
最小值
和
最大值
,如mysql文档3.6.1
中
所述,但我不知道如何
从<
浏览 2
提问于2011-11-10
得票数 0
回答已采纳
1
回答
如何在不重命名列
的
情况下计算单行数据框
列
的
平均值、
最大值
、
最小值
、
、
、
如何在不使用
pyspark
重命名列
的
情况下,
从
单行数据框
列
中计算同一
列
的
平均值、
最大值
、
最小值
我使用了下面的命令,但它抛出了一个错误 df5=df5.agg(avg(col("Salaray")),
浏览 22
提问于2021-10-29
得票数 0
2
回答
查询时
获取
最小
最大值
所在
的
日期
、
在某些日期之间查询时,有没有办法
获取
最小值
和
最大值
出现
的
日期? 假设我查询
的
时间是
从
每月1号到31号,我想知道给定
列
的
最小值
和
最大值
发生在哪一天。
浏览 22
提问于2021-03-01
得票数 0
1
回答
Python pandas dataframe:为
另一
列
的
每个唯一
值
查找max
、
、
、
我有一个很大
的
数据帧(
从
500k到1M行),其中包含例如以下3个数字
列
: ID、A、B 我想对结果进行过滤,以获得一个如下图所示
的
表,其中,对于
列
id
的
每个唯一
值
,我都有A
和
B
的
最大值
和
最小值
。编辑:为了更清楚,我已经更新了下面的图像:当我从一
列
中
获取
最大值
或
最小值
时,我还需要
获取</
浏览 0
提问于2016-11-13
得票数 9
回答已采纳
2
回答
电火花码群函数
中
的
一个错误
、
、
、
、
chess_wc_history_game_info.csv",但在执行过程
中
,我得到了一个错误,因为: AttributeError: 'GroupedData' object has no attr
浏览 12
提问于2022-08-09
得票数 0
1
回答
如何根据公式
和
其他
列
的
唯一
值
创建新
列
?
、
、
、
我想创建一个新
的
列
df'b‘,它具有一个特定
的
方程,取df'a’
的
最大值
和
最小值
。5, 5, 3, 3, 6, 6, 1]}) equation = (df['a'] - df['a'].min()) / (df['a'].max() - df['a'].min()) 但是,这些
最大值
和
最小值
应该与df‘’
浏览 3
提问于2020-09-18
得票数 1
回答已采纳
1
回答
GroupedData上
的
方差计算
、
、
、
我试图在GroupedData 2
中
计算
PySpark
对象
的
方差,而在
中
,我没有看到任何用于计算方差
的
内置函数。from
pyspark
.sql import
浏览 3
提问于2017-10-21
得票数 0
回答已采纳
2
回答
awk
中
列
的
最大值
不正确
、
我有这样
的
数据:10 30 50 15 我想要获得
列
的
最大值
,跳过第一行,所以我尝试:附言:它返回Values,这也不是很好
浏览 0
提问于2012-08-20
得票数 0
回答已采纳
1
回答
在
pyspark
dataframe
中
检索
最大值
时遇到问题
、
、
、
、
在我通过使用窗口
和
对一组
列
进行分区来计算
pyspark
dataframe
中
每行5行内
的
平均数量
之后
from
pyspark
.sql import functions as Fconsecutive_df = prep_df.withColumn('aveg', F.avg(prep_df['quantity']).over(window)) 我尝试使用相同<em
浏览 14
提问于2020-06-19
得票数 0
回答已采纳
2
回答
pyspark
中柱
的
归一化或缩放
、
、
我想在
pyspark
中
扩展一个特定
的
列
。(1,28,98),(2,27,12),(3,28,99),(4,28,5),(5,27,54)], minmax_result = df.
groupBy
results") - col("min_results")) / col("min_results"))).alias("s
浏览 72
提问于2019-12-19
得票数 0
1
回答
显示组
和
agg
之后
的
所有火花放电
列
我希望按一
列
分组,然后找到
另一
列
的
最大值
。最后,显示基于此条件
的
所有
列
。然而,当我使用我
的
代码时,它只显示2
列
,而不是所有
列
。# Normal way of creating dataframe in
pyspark
(2,2,'0-2spark.createDataFrame([ (4,6
浏览 0
提问于2020-01-19
得票数 0
回答已采纳
1
回答
如何合并重复项并从其他
列
获取
min/max
值
?
、
、
我希望在一
列
中
合并重复项,并从其他两
列
中
获取
最小/
最大值
:例如,
从
该文件
中
:100627109.00 100637104.0027612292.00 27626240.00 y27612669.00 27626569.00 y我希望在第三
列
(x
浏览 4
提问于2022-07-15
得票数 -3
回答已采纳
1
回答
计算D3阵列
和
积
的
最大值
、
我正在读取一个csv文件,需要使用D3.js或普通JavaScript从这些数据中计算两个数字:一旦我
的
数据被读取,我需要遍历每一
列
,标记为“一”到“十”(这个数据
的
长度是未知
的
,所以它可能高达12或20), 将“乘数”后面的每一
列
乘以称为“乘数”
的
变量(在数据
中
,我给出了任意
值
1.5、1、0、5以使阅读更加清晰)。这给出了一个新
的
数字网格,其中每个新数字
的
浏览 1
提问于2014-11-25
得票数 0
回答已采纳
3
回答
pandas按第一
列
值
分组,并查找剩余
列
的
最大值
、
、
、
、
4 15 Canada 1 17 Mexico 1 1 我想要做
的
是按第一
列
的
值
进行分组,对于相应
的
组,找到第二
列
和
第三
列
中
的
最大值
。
浏览 30
提问于2021-07-29
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
一个Python大数据处理利器:PySpark入门指南
Python Pandas模块数据统计与分析常用方法
巧用Excel工作表中的“条件格式”制作旋风图,既快捷又方便!
肝了3天,整理了90个Pandas案例
python 多表查询字段或者值
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券