腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
PySpark
中
的
滚动
相关性
和
每个
组
的
平均值
(
最后
3个)
、
、
、
我有一个这样
的
数据帧 data = [(("ID1", 1, 5)), (("ID1", 2, 6)), (("ID1", 3, 7)),|ID2| 2| 6||ID2| 4| 1|+---+----+----+ 我想要计算
最后
3个
相关性
和平均,每组,
最后</em
浏览 46
提问于2019-12-24
得票数 1
回答已采纳
1
回答
PySpark
中
每个
组
的
平均值
、
、
我有下面的
PySpark
数据帧: cust | amount | A | 5 | A | 3| 2 | C | 7 | C | 5 | 我需要按列'cust'分组,并计算
每个
组
的
平均值
data.withColumn("avg_amount", F
浏览 32
提问于2021-02-01
得票数 0
回答已采纳
1
回答
取每行10000次随机抽样
的
平均值
我做了10000次复制,我从一个ID列表
中
随机抽取样本,然后将它们与另一个ID列表配对。在那之后,我添加了一个列,它给出了对彼此
的
关联性。然后我取了每组随机抽样
的
相关性
的
平均值
。所以我最终得到了10000个值,它们代表了每组随机采样
的
相关性
的
平均值
。然而,我想取而代之
的
是所有10000
组
随机抽样
的
第一行
的
相关性
的</em
浏览 1
提问于2017-10-13
得票数 0
1
回答
Stata
中
具有相关关系
的
紧表
、
我希望创建一个表,其中包含两
组
变量之间
的
相关性
(即,第1
组
中
的
每个
变量与第2
组
中
的
每个
变量之间
的
相关性
,以及与我不需要
的
同一
组
中
的
变量之间
的
相关性
),以便
最后
一个表具有第一
组
变量
的
名称
的
浏览 1
提问于2015-10-25
得票数 1
回答已采纳
2
回答
对大于
平均值
的
值应用分组
我有一个向量,我想根据向量
中
的
值
的
滚动
平均值
进行分组。如果数值大于
平均值
,则将其放入
组
1,如果值小于
平均值
,则将其放入
组
2。在我
的
向量
中
,可以使用哪个函数来为
每个
to值指定一个
组
号,以确定它
的
值是否大于当前
平均值
。
浏览 2
提问于2013-04-04
得票数 0
回答已采纳
2
回答
电火花码群函数
中
的
一个错误
、
、
、
、
format="csv", sep=",", inferSchema="true", header="true") 但在执行过程
中
,
浏览 12
提问于2022-08-09
得票数 0
1
回答
以群体为手段
、
、
、
我有一个有几个列
和
几行。我想按一个名为"A“
的
栏目分组。我可以通过df.groupby('A')来完成这个任务。现在,我想采用
每个
组
中
称为"C“
的
列
的
方法,这是我可以用df.groupby('A').C.mean()做
的
。
最后
,我想取C栏
中
每一
组
的
平均值
。我怎样才能做到这一点(
最后
<em
浏览 0
提问于2018-06-14
得票数 0
回答已采纳
1
回答
有条件大熊猫
的
平均移动率
、
我有一个具有以下结构
的
dataframe:import pandas as pd { "x": [1, 2, 2, 3, 2, 3, 4, 2], }df
每个</em
浏览 5
提问于2022-04-26
得票数 1
回答已采纳
3
回答
PySpark
DataFrame上分组数据
的
熊猫式转换
、
、
、
、
如果我们有一个由一列类别
和
一列值组成
的
Pandas数据框架,我们可以通过执行以下操作来删除
每个
类别
中
的
平均值
:据我所知,不直接提供这个按
组
/转换操作(我在Spark1.5.0上使用
PySpark
浏览 8
提问于2015-12-25
得票数 19
回答已采纳
1
回答
pandas -如何通过计算而不是迭代向量化分组
这是一个代码片段,用来模拟我面临
的
问题。
浏览 14
提问于2020-10-07
得票数 1
回答已采纳
1
回答
如何获得
PySpark
数据中
最后
5行
的
平均值
、
、
、
、
我正在在线监视数百个用户
的
活动,并试图获得
最后
5行
的
平均记录(忽略中间缺少
的
日期)。我使用Window.partitionBy在用户
和
rowsBetween之间进行分区,以获得
最后
5条记录,但不是为后面的每一行提供
最后
5条记录
的
平均值
,而是将所有其他行都包含到
平均值
中
。这就是我尝试过
的
: from
pyspark
.sql import functions as f
浏览 1
提问于2021-02-23
得票数 1
回答已采纳
2
回答
在r
中
找出多列与一列
的
聚合
相关性
、
我有一个有11列
的
数据框架,其中9列是数字
的
。我试图找出8列与其余列
的
相关性
,即8个变量与1个变量
的
相关性
,而不是在一个矩阵中生成9个不同
的
值。9 2.73021114 -0.130141775 1.85304372 90
浏览 7
提问于2015-05-31
得票数 2
回答已采纳
1
回答
了解回归结果
、
、
、
、
我有一
组
描述不同时间点
的
现象
的
数值特征。为了评估
每个
特性
的
个别性能,我进行了一个线性回归,并排除了一个验证,并计算了
相关性
和
误差,以评估结果。因此,对于一个功能,应该是这样
的
: 根据F对P进行线性回归,再加上剔除1。评估:计算
相关性
(线性
和
spearman)
和
误差(平均绝对值
和
浏览 1
提问于2015-12-08
得票数 0
回答已采纳
2
回答
如何使用Pandas计算GroupBy对象
的
滚动
均值?
、
、
如何使用Pandas计算GroupBy对象
的
滚动
均值?我
的
守则:df = df.set_index('ds')grouped_df是什么样子
的
:我希望使用Pandas计算我
的
GroupBy对象
中
每个
组<
浏览 1
提问于2015-10-18
得票数 1
回答已采纳
1
回答
随机采样两个向量,找出样本
的
均值,然后在R中生成矩阵?
、
、
我
的
数据框架很简单。两列:第一列有基因型(1-39),第二列有性状值(数值,连续)。我想选择8个基因型,并计算
相关性
状值
的
平均值
和
stdev值。
最后
,我想对8种基因型进行10,000次
的
抽样,而对于每一个样本,我希望得到
相关性
状值
的
stdev和
平均值
。理想
的
情况是,在矩阵
中
,每一行代表一个样本,每种基因型代表8列,对于stdev
和
与这些基因型关联
的</em
浏览 1
提问于2012-06-05
得票数 1
1
回答
R数据
组
的
多个
滚动
平均窗口
、
、
使用数据(方),假设我知道成交量
和
开盘价之间存在平滑
的
关系。此外,我知道最具预测性
的
滚动
均值
的
长度因股票而异。对于一些人来说,它是很短
的
,一天2天。对于其他10。我想为
每个
股票创建多个
滚动
长度在2到10天之间
的
方式。 到目前为止,我尝试了tibbletime包,并获得了一个开始,这样我就可以计算其中一个
的
多个
滚动
平均值
。它创建了
滚动
方法,但不是按
组</em
浏览 0
提问于2018-09-05
得票数 0
2
回答
多变量时间序列异常检测
、
、
、
、
如您所见,我有四个事件,以及
每个
事件在不同时间内发生
的
总次数。 一个小时后,我将获得
每个
事件
的
新发生次数,因此我希望根据该事件
的
历史水平来判断该事件
的
发生次数是否异常。我认为如果我为
每个
事件建立四个不同
的
回归很容易,但在现实生活
中
,我可能会有许多事件,这会降低效率,所以我想知道解决这个问题
的
最好方法是什么?有什么我应该试试
的
模型吗?我读到了KNN,但不需要分类标签,而我
的
情况
浏览 10
提问于2020-11-07
得票数 0
1
回答
Pandas -了解
滚动
平均是如何工作
的
、
、
因此,我正在尝试计算
滚动
平均值
,基于一些列
和
一些分组列。在我
的
例子
中
:groupby_columns =“人口统计”,“发起人”,"START_ROUND_60","WDAY","PLAYBACK_PERIOD“df['rolling'
浏览 1
提问于2020-09-07
得票数 0
1
回答
如何计算熊猫
每个
亚群
的
平均值
的
偏差
、
在我目前正在处理
的
一个数据集中,我尝试计算每一行
的
'Total‘
的
偏差,这取决于以下数据帧
中
的
每个
子
组
:所以我
的
目标是,例如,计算‘分支’列
中
每个
'A‘
的
'Total’
的
偏差,以及这组‘A’
的
平均值
,以及数据
中
每个
可能
的
子
组
的
浏览 10
提问于2019-10-29
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Google Ads质量得分优化技巧!
Facebook批量优化360照片
PySpark数据分析基础:PySpark原理详解
pyspark 安装
一篇文章看懂t检验
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券