腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
每
一行
的
PySpark
中
列
的
差异
百分比
、
、
我正在尝试计算数据帧
中
每
一行
的
列
之间
的
百分比
差异
。这是我
的
数据集: ? 例如,对于第
一行
,我试图获得2016年与2015年
的
变化率,2017年与2016年
的
变化率……只应删除2015和2019,以便它们在末尾将是5
列
。
浏览 23
提问于2021-01-02
得票数 0
回答已采纳
4
回答
用火花放电计算groupBy
的
总计数
百分比
、
我在
pyspark
中有以下代码,从而生成一个表,显示
列
的
不同值及其计数。我希望有另一
列
显示
每
一行
所代表
的
总数
的
百分比
。我该怎么做?
浏览 0
提问于2018-09-11
得票数 14
回答已采纳
1
回答
将函数生成
的
列
生成为新
的
dataframe
、
、
我有一个带有n个cols
的
percentage ( df ),我想要生成另一个n cols
的
df,其中
每
一
列
都记录相应
的
原始df
列
中
的
b/w连续行
的
百分比
差。新df
中
的
列
标题应该是旧dataframe + "_diff“
中
相应
的
列
标题。使用下面的代码,我可以为原始df
中
<e
浏览 0
提问于2018-05-31
得票数 0
回答已采纳
1
回答
如何使用
PySpark
结构化流计算时间戳之间
的
差异
、
、
我对
PySpark
结构化流有以下问题。 流数据
中
的
每
一行
都有一个用户ID和一个时间戳。现在,对于
每
一行
和每个用户,我想添加一个带有时间戳
差异
的
列
。例如,假设我收到
的
第
一行
是:"User A,08:00:00“。如果第二行显示"User A,08:00:10“,那么我想在第二行
中
添加一个名为"Interval”
的
<em
浏览 0
提问于2019-11-14
得票数 1
1
回答
pyspark
sql浮点精度错误
、
、
我有一张这样
的
桌子 | fruit|fruit_number| | apple|melon| 31| |banana| 4|我想生成
每
一行
的
百分比
,但当我对
百分比
列
求和时,我无法获得100%。这里是我在
pys
浏览 0
提问于2016-10-20
得票数 2
1
回答
如何将除string以外
的
任何数据类型转换为
pyspark
dataframe
中
的
字符串
、
、
、
、
我正在尝试对两个数据格式
中
的
每
一行
应用
pyspark
函数散
列
算法来识别
差异
。散
列
算法是基于字符串
的
,所以我尝试将任何数据类型转换为字符串。我在日期
列
转换
中
面临大多数问题,因为在转换为字符串之前,需要更改日期格式,以使基于哈希
的
matching.Please保持一致,帮助我完成该方法。#Identify the fields which are not strings from <e
浏览 1
提问于2018-02-02
得票数 0
回答已采纳
3
回答
如何将整个
pyspark
数据帧
的
大小写更改为下或上
、
、
、
、
我正在尝试对两个数据帧
中
的
每
一行
应用
pyspark
sql函数散
列
算法,以确定
差异
。哈希算法是区分大小写
的
.i.e。如果
列
包含'APPLE‘和'Apple’被认为是两个不同
的
值,所以我想将两个数据帧
的
大小写都改为上或下。
浏览 41
提问于2018-02-01
得票数 6
回答已采纳
1
回答
为什么用excel表格计算
的
偏斜值与用
pyspark
/scipy计算
的
值不同?
、
、
、
import skew skew(val) 利用excel对斜率进行计算,将
每
一行
的
值排列成一
列
,并使用斜率函数为什么偏斜值会有
差异
?同样
的
事情也发生在熊猫和火种身上。用
pyspark
计算偏斜时,其结果与scipy相同,用pandas计算时,其结果与excel相同。
浏览 0
提问于2020-05-30
得票数 0
1
回答
R:如何找到
列
之间
的
百分比
差异
并相应地命名?
df1 2 100 50 603 4 50 50 75 我想对所有的
列
都这样做,并将
百分比
差异
放到一个新
浏览 2
提问于2016-05-29
得票数 0
回答已采纳
2
回答
pyspark
数据帧中所有
列
的
总计数为零
、
、
我需要找出
pyspark
dataframe中所有
列
中
0
的
百分比
。如何在数据帧中找到
每
一
列
的
零计数? 附言:我尝试过将数据帧转换为pandas数据帧,并使用了value_counts。但是,对于大型数据集来说,推断它
的
观察值是不可能
的
。
浏览 0
提问于2018-08-20
得票数 4
1
回答
Pandas在合并
的
dfs之间比较相同
的
列
、
、
、
team 2 50 50new york team 2 30 70然而,我实际上有成百上千
的
指标,比如“得分”。在合并完成并追加_x和_y之前,如何找到合并后
的
df
中
具有相同键
的
浏览 1
提问于2018-02-12
得票数 1
回答已采纳
2
回答
如何将2个RDDs
的
列
从单个RDD
中
添加到其中,然后根据
PySpark
中
的
日期数据进行行聚合
、
、
、
、
我在
PySpark
中有两个
PySpark
:[(u'2013-01-31 00:00:00', u'a', u'Pab', u'abc', u'd'),(u'2013-01-31 00:00两个RDDs都有相同
的
数字或行。现在,我要做
的
是从RDD1(从unicode转换到普通string)和RDD2
中
每
一行
的
第二
列
浏览 7
提问于2015-12-07
得票数 5
1
回答
在udf
中
获取struct数据类型
的
字段名。
、
、
、
我试图将多个列作为一个udf (使用
pyspark
.sql.functions.struct())传递给一个StructType。在这个udf
中
,我希望获得作为list传递
的
struct
列
的
字段,这样我就可以对
每
一行
遍历传递
的
列
。 基本上,我正在寻找这个答案- 中提供
的
scala代码
的
pyspark
版本。
浏览 1
提问于2019-09-04
得票数 1
回答已采纳
1
回答
用火花放电流到HBase
、
、
、
在线上有相当数量
的
关于使用Scala进行星火流
的
批量加载
的
信息( 是特别有用
的
),以及一些用于
PySpark
的
信息,但是使用
PySpark
似乎缺乏这样
的
信息。所以我
的
问题是: 任何语言中
的
大多数示例都只显示
每
一行
上
的
一个
列
。如何在
每
浏览 2
提问于2016-01-29
得票数 3
1
回答
两个事件
的
百分比
差异
、
我有一个数据框架,如下所示:1 1 53 1 7对于
每
一行
,我希望计算两个事件之间集中度
的
百分比
差异
,并将其添加到新
列
中
。例如:对于ID=1我需要帮助如何为每个单独
的
行指定(CONCrow2-CONCrow 1)。
浏览 0
提问于2015-01-07
得票数 3
回答已采纳
4
回答
R
中
数据帧
中
列
中
零
的
计数,并以
百分比
表示
我希望计数R数据帧
中
每
列
中
的
零数,并将其表示为
百分比
。是否应将此
百分比
添加到原始数据帧
的
最后
一行
?示例y <- c(3, 0, 9, 12, 15)希望查看
每
列
中
的
零,并以
百分比
表
浏览 1
提问于2013-09-23
得票数 4
回答已采纳
1
回答
检查火花数据
中
的
行值是否为空。
、
、
、
、
我正在使用
pyspark
中
的
自定义函数来检查星火数据true
中
每
一行
的
条件,如果条件为true,则添加
列
。守则如下:from
pyspark
.sql.functions import *sdf.show() 我在下面提到了
浏览 3
提问于2016-08-19
得票数 7
1
回答
Tableau删除行
、
有人可以建议如何删除空白和2020年
的
差异
和
百分比
差异
的
零。我只想找出从2021年到2020年
的
差异
,其中
差异
将显示在
一行
中
,仅显示在2021以下,而
百分比
差异
将显示在另
一行
中
。 ?
浏览 119
提问于2021-11-04
得票数 2
2
回答
如何在火花放电
中
获得groupBy后每次计数
的
总数
百分比
?
给定以下DataFrame:findspark.init()+--------+-----+| b| 2|+--------+-----++--------+-----+
浏览 2
提问于2018-09-10
得票数 7
回答已采纳
1
回答
帮助计算postgresql
中
后继行中所有先前行
的
和
、
我有以下观点,它计算了每个站点id
的
每个日期所使用
的
站点资源
的
百分比
增长:我想要完成
的
是,添加一个额外
的
列
,它将显示
每
一行
前面所有
百分比
增加
的
总和。因此,最后一个表应该如下所示:这里
的
Column1只是为了进一步澄清我在这里试图实现的确切想法。“按日期计算
的
总
百分比
”
列
中
的
浏览 0
提问于2020-05-02
得票数 -1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券