腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
Scala
Spark
中
,
如何
分组
并将
组
中
的
每个
值
除以
该
组
中
的
行数
scala
、
apache-spark
我想要按名称
分组
,获得等于0
的
分数,然后将该数字
除以
组
的
总规模。因此,它应该为"Steve“
组
返回2/3,为"Michael”
组
返回1/3,为"Katherine“
组
返回1/2,为"Devin”
组
返回1/1。 谢谢!
浏览 5
提问于2020-11-10
得票数 0
回答已采纳
1
回答
Spark
Dataframe Group By Operation并从
每个
组
中选取N个
值
python
、
scala
、
apache-spark
、
apache-spark-sql
我有一个如下结构
的
spark
数据帧:和一个变量:val n = 100 我想对数据框
中
的
然后,我想为
每个
组
中
的
n请求(没有排序)获取RequestURL和RequestBody列(为此创建一个新
的
data-frame/rdd/map )。如果一个
组
的
请求少于n
浏览 3
提问于2019-07-05
得票数 0
1
回答
熊猫
组
:
组
中最后一
组
,第一
组
python
、
pandas
我有一个按多列
分组
的
数据。
在
每个
组
中
,我想生成一个
值
,
该
值
查找
每个
组
的
最后一个实体,然后
除以
第一个实体。我还想显示实体
的
数量和输出
中
的
最后一个实体
值
。 有关示例数据和所需输出,请参见下面的内容。我知道
如何
显示
组
的
计数,代码如下所示。ID
浏览 0
提问于2018-11-06
得票数 2
回答已采纳
2
回答
如何
将总和
除以
熊猫
组
中
的
大小
python
、
pandas
我有一个像这样
的
数据帧0 a b 12 a b 05 a c 1 我想按'ID_0','ID_1‘
分组
,并生成一个新
的
数据帧,其中包含
每个
组
的
ID_2
值
之和
除以
每个
组
中</e
浏览 0
提问于2016-09-29
得票数 7
回答已采纳
1
回答
n=n( )
在
R
中
是什么意思?
r
、
grouping
、
dplyr
前几天,我
在
R
中
读了下面这几行,我不明白%>%、summarise(n=n())和summarise(total=n())是什么意思。不过,我理解group_by和ungroup方法。
浏览 3
提问于2014-09-16
得票数 9
4
回答
一
组
分离后计算平均超柱数
python
、
pandas
、
dataframe
、
group-by
、
pandas-groupby
DataFrame包含a和b列,其中b包含与True和False对应
的
值
Y或N。我想用a
分组
,然后,为每一
组
,得到
组
中
b's (meaning, the number ofTrue`s
的
平均值
除以
该
组
中
的
行数
)。到目前为止我得到
的
是 data['b'] = data['b'].map({'
浏览 1
提问于2018-10-24
得票数 1
回答已采纳
2
回答
将自定义函数应用于星火数据访问
组
apache-spark
、
dataframe
、
group-by
、
dataset
、
pyspark
我有一个非常大
的
时间序列数据表,其中包含以下列: 我计划在dataframe中使用
spark
,但我对
如何
对
spark
分组
数据执行自定义计算感到困惑。我需要做
的</
浏览 2
提问于2016-09-20
得票数 10
回答已采纳
3
回答
熊猫,
分组
数据和标准化
值
在
每一
组
python
、
pandas
、
dataframe
我有一个csv文件,其中包含由ID标识
的
不同组,如下所示:aaa,3aaa,4bbb,54我需要: 计算
每个
组
中
x
的
平均值;将x
的
每个
值
除以
该
特定
组
的
所以,
在
我上面的例子
中
,'aaa‘
组
的
平均值是4,而在'bbb’
中
浏览 2
提问于2020-12-21
得票数 0
回答已采纳
1
回答
为什么我
的
公式
在
转换数据类型时返回0或100?
postgresql
我想数一下这个名字的人
的
百分比取决于他们
的
id,这里是我
的
脚本:else 0 from scientist因此,所需
的
表应该如下所示
浏览 3
提问于2021-07-07
得票数 0
回答已采纳
3
回答
每个
GROUP BY
的
总行
php
、
mysql
、
count
、
group-by
我正在尝试运行一个MySQL查询,并使用PHP执行以下操作:Version_Number1.
浏览 1
提问于2011-11-07
得票数 0
回答已采纳
1
回答
xquery
组
(不排除重复项)
xpath
、
xquery
、
xquery-3.0
first_name>Bezalel</first_name> </row>我希望对名字进行排序,并删除重复
的
名字first_name>Georgi</first_name> </row> <
浏览 1
提问于2018-02-16
得票数 1
2
回答
SQL - Count(*)未按预期方式行事
sql
、
ms-access-2007
1,无论从查询
中
返回多少行。我怀疑我没有正确地实现我
的
GROUP BY方法。如果我正确理解它,所有被选中且不是聚合函数一部分
的
列(
在
我
的
例子
中
是COUNT)都应该放在GROUP BY
中
。任何帮助都是非常感谢
的
。提前感谢Col1 Col2 Degrees A X 1
浏览 0
提问于2015-08-20
得票数 0
1
回答
深入查看ssrs报表
中
的
行数
上
的
分页符
visual-studio-2012
、
reporting-services
、
page-break
我
在
SSRS (vs2012)中有一个仅包含
组
的
向下钻取报告。我需要有基于用户指定
的
每页
行数
参数
的
分页符。我添加了一个
组
,
该
组
是所有其他向下钻取
组
的
父
组
,并检查了
组
的
每个
实例之间
的
分页符。
该
组
使用以下表达式: =Ceiling(RowNumber("table1&q
浏览 1
提问于2014-02-08
得票数 0
3
回答
将单个数字
除以
每组
中
的
行数
sql
、
sql-server
分组
编号(列A)
在
Type列
中
的
每个
不同
值
处在1重新启动。我希望将100
除以
所有类型
的
10个总
组
,然后将
每个
组
的
结果数字
除以
每个
分组
中
的
条目数(行)。列A + Type是我
的
组
标识符,列B是我想要
的
最终结果。 我尝试了一些基于嵌套查询<em
浏览 3
提问于2015-09-18
得票数 0
回答已采纳
2
回答
Excel计算和循环引用
excel
、
formula
、
vba
我需要对一列数字执
行数
学运算,使用
该
列
中
的
相同
值
,
并将
响应返回给同一列。这是一个循环循环。
浏览 2
提问于2013-11-22
得票数 1
2
回答
在
Spark
中
对行进行
分组
apache-spark
、
apache-spark-sql
我正在使用
Spark
2.4.0,想知道
如何
使用
Spark
来处理以下问题: 以下数据框
中
的
每个
条目可以具有两种不同
的
格式,并提供其ids。我想要做
的
是,如果两个条目共享相同
的
id (格式1或格式2),则将它们
分组
在一起,并为
每个
组分配一个
组
id。2
中
共享相同
的
id,因此它们被
分组
在一起并被分配相同
的
组<
浏览 16
提问于2019-10-26
得票数 1
回答已采纳
2
回答
如何
在web UI
中
更改作业/阶段描述?
apache-spark
当我
在
Apache
Spark
上运行作业时,web UI给出了一个类似于以下内容
的
视图:虽然这对我作为开发人员来说非常有用,但我认为阶段描述
中
的
行号对我
的
支持团队并不是很有用。为了让他们
的
工作更轻松,我希望能够为我工作
的
每个
阶段以及工作本身提供一个定制
的
名称,如下所示:这是可以
在
Spark
中
完成
的
事情吗?如果是这样,我<e
浏览 0
提问于2017-01-28
得票数 25
回答已采纳
3
回答
如何
计算DataFrame
中
的
移动中值?
apache-spark
、
apache-spark-sql
、
window-functions
、
median
、
spark-window-function
是否有一种方法可以计算星火中某个属性
的
移动中间?我本来希望可以使用一个窗口函数(通过使用rowsBetween(0,10)定义一个窗口)来计算移动中值,但是没有计算它
的
功能(类似于average或mean)。
浏览 10
提问于2017-05-19
得票数 3
1
回答
Apache
Spark
在
reducer端使用键和源数据
的
映射而不是groupByKey()有什么好处吗?
apache-spark
在
回顾这个问题时,,我发现我有类似的需求,但数据集要大得多。好消息是,我
的
每个
组
的
数据将适合在reducer端
的
内存
中
。{"key1": "1", "key1": "2",
浏览 0
提问于2016-06-26
得票数 1
2
回答
如何
在R
中
创建一个表,
该
表显示每年观察
值
等于某一
值
的
百分比?
r
、
dplyr
、
group
我正在使用一个时间序列数据集,讨论独裁政权
的
反对程度。我已经包括了下面的数据样本。我想要生成一个表,
该
表显示每年国家百分比,其
值
为1 for v2psoppaut。有人能告诉我怎么做吗?我想要生成一个表,我可以保存为一个新
的
df进行绘图。
浏览 6
提问于2022-05-26
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Spark实战(5)_Spark Core核心编程
Power BI 8月产品功能更新
Spark1.6官方文档译文系列一
Spark机器学习模块开发环境部署与实例
教程:Apache Spark SQL入门及实践指南!
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券