腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
PySpark
中
未
使用
with
列
条件
替换
的
空
值
、
、
、
、
我已经编写了一段
PySpark
代码,用于设置这样
的
条件
:如果给定
列
中
存在
空
值
,则将“Yes”附加到另一
列
,否则将“No”附加到另一
列
。data = data.withColumn('Coupon_code',when((data.coupon ==""),"No coupon").otherwise("coupon")) 这里
的
条
浏览 22
提问于2020-12-08
得票数 0
回答已采纳
1
回答
检查火花数据
中
的
行
值
是否为
空
。
、
、
、
、
我正在
使用
pyspark
中
的
自定义函数来检查星火数据true
中
每一行
的
条件
,如果
条件
为true,则添加
列
。守则如下:from
pyspark
.sql.functions import *sdf.show(
浏览 3
提问于2016-08-19
得票数 7
2
回答
在数据模型
中
,如何用"NA“
替换
(协调)”不适用“、”不适用“、”未知“等值?
、
、
我正在处理一个包含1000 s
列
的
df (一些
列
包含数字
值
,一些
列
包含字符和一些逻辑
值
),我
的
df conatins
值
如“不适用”、“未知”、“未确定”等。如何用"NA“
替换
所有这些
值
?--我尝试过遵循下面的代码,它输出
空
单元格,而不是用"NA“
替换
。na_string <- c("NA“、"Not_Applicable”、“不可用”、
浏览 0
提问于2020-09-04
得票数 1
回答已采纳
1
回答
如何根据另一个数据填充
空
、
我现在开始
使用
火花放电。我有两个
列
dataframe和一个
列
包含一些
空
,例如。来填写df1
中
的
空
。我首先从df2创建一个查找字典,然后
使用
df1上
的
apply来填充
空
值
。但是我并不确定在
pyspark
中
使用
什么函数,我看到
的
大多数
替换
null都是基于简单
的
条件
,例如,将所有的
空</em
浏览 2
提问于2018-03-14
得票数 1
回答已采纳
2
回答
用电火花
替换
结构型柱
的
空白点
、
、
、
、
我有一个用例,希望用
空
值
替换
StructType
列
中
的
空
值
。下面是示例,您可以
使用
它重新创建场景: ),) df.show(
浏览 3
提问于2022-01-31
得票数 1
回答已采纳
3
回答
如何在
Pyspark
中
替换
dataframe
的
所有空
值
、
、
我在
pyspark
中有一个超过300
列
的
数据框架。在这些
列
中
,有一些
列
的
值
为null。_2null null125 124and so on 当我想对column_1求和时,我得到
的
结果是一个
空
值
现在,我想用空格
替换
数据框所有
列
中
的<
浏览 1
提问于2017-02-18
得票数 56
回答已采纳
1
回答
在
pyspark
中
,将
值
随机更改为
空
值
的
最有效方法是什么?
、
、
尝试弄清楚如何用
空
值
随机
替换
Pyspark
中
的
特定
列
。: | A | B || 1 | 2 || 5 | 6 || 9 | 10 ||----|------| | 1
浏览 29
提问于2020-09-18
得票数 2
回答已采纳
1
回答
嗨,请你帮我解决问题,同时在
Pyspark
中
创建新
的
专栏:我解释了这个问题如下:
、
我
使用
的
查询: if i[4:]!
浏览 0
提问于2018-10-20
得票数 0
回答已采纳
1
回答
如何检测
pyspark
中
的
单调下降
、
、
、
我正在
使用
spark DataFrame,我希望检测来自特定
列
的
任何
值
,其中该
值
不是单调递减
的
。对于这些
值
,我想根据排序
条件
将它们
替换
为以前
的
值
。下面是一个概念性
的
示例,假设我有一个
值
为[65, 66, 62, 100, 40]
的
列
。
值
"100“不遵循单调下降趋势,因此应
替换
为62。
浏览 15
提问于2020-02-14
得票数 1
回答已采纳
1
回答
创建一个客户用户定义
的
函数,用于
使用
平均中值模式
替换
丢失
的
行
、
、
、
我尝试在python
中
创建一个自定义用户定义
的
函数,通过
使用
平均值、中值和模式
值
来
替换
dataset
中
缺少
的
值
。但我无法获得所需
的
输出。当数据集中
的
列
不倾斜时,将用它
的
平均值
替换
空
值
。当数据集中
的
列
被倾斜时,
空
值
将被它
的<
浏览 7
提问于2022-07-17
得票数 0
回答已采纳
1
回答
用平均值
替换
null
、
、
在
PySpark
的
重采样操作
中
,我遇到了问题。我
的
数据是:+-------------------+------------------+,通过
使用
Spark函数,将"sum“
列
中
的
空
值
替换
为"sum”
列
中
前一个和下一个变量
的
平均值。如果"sum“
列
中有nu
浏览 0
提问于2018-09-10
得票数 0
回答已采纳
1
回答
通过填充现有
列
在
Pyspark
中
创建新
列
、
我正试图在现有的DataFrame
中
创建新
列
。10|null|null|null|+----+----+---+----+----+----+----++------+------+-----+------+------+----
浏览 4
提问于2019-12-17
得票数 0
回答已采纳
1
回答
pySpark
替换
特定
列
中
的
空
值
、
、
、
、
但是,下面的代码将数据
中
的
所有空
值
替换
为"nI“。我只想为被重命名
的
列
替换
空
。我想在不硬编码任何列名
的
情况下这样做。
浏览 1
提问于2020-06-05
得票数 2
回答已采纳
2
回答
如何用
PYSPARK
中
的
平均值
替换
空
值
?
、
、
、
如何用平均值
替换
列
col1
中
的
空
值
?然而,有以下
条件
:1 121 142 222 NaN3 NaN id=1
的
NaN
值
应由id=1上计算
的
col1平均值(即12 ((12+14+10)/3)来代替)。像id=3这样
的
情况可以忽略,NaN可以保留。我用
PYS
浏览 0
提问于2019-07-25
得票数 0
回答已采纳
1
回答
替换
Pyspark
Dataframe
中
列
中
的
空
值
、
、
、
我需要
替换
Spark dataframe
中
列
中
存在
的
空
值
。下面是我尝试过
的
代码 df=df.na.fill(0,Seq('c_amount')).show() 但是它抛出了一个错误NameError: name 'Seq' is not defined 下面是我
的
表格
浏览 144
提问于2020-07-02
得票数 0
回答已采纳
1
回答
将列有
条件
地添加到数据帧
中
、
、
、
、
我在
PySpark
中有一个数据帧。我想有
条件
地在数据框架
中
添加一
列
。 如果数据帧没有
列
,那么添加一个带有null
值
的
列
。如果
列
存在,则不执行任何操作,并返回与新数据帧相同
的
数据帧。如何在
PySpark
中
传递
条件
语句
浏览 6
提问于2017-01-20
得票数 0
回答已采纳
1
回答
替换
#Name
的
SSIS
条件
?并且不显示任何
值
、
当我运行我
的
SSIS包时,我收到一个#Name?在不存在
值
的
列
单元格
中
,因此我
使用
以下
条件
创建了一个
条件
拆分:ISNULL(列名) || LEN(列名) == 0。客户希望
列
单元格为
空
,而不是显示0。当我将0
替换
为?或“”,则
条件
拆分无法识别该字符。感谢您能给予
的</e
浏览 5
提问于2017-09-26
得票数 0
1
回答
在
Pyspark
中将缺少
的
字符串
值
转换为isNull
、
、
、
我对
pyspark
非常陌生,我有一个从csv (在胶水中)加载
的
数据集。有一
列
code,其中有string和long。将缺少
的
值
视为string。我通过像这样扁平化
列
找到了这一点。string,但是我找不到如何使null
值
(上面的)成为
使用
isnan时显示
的
实际null
值
。如何将它们转换为“真实”
的
null
值
(可被isNull()识别)?
浏览 2
提问于2020-04-30
得票数 0
2
回答
使用
spark sql获取前一行
的
值
、
、
、
我有一张这样
的
桌子。0 6 0 0 我想添加一个新
列
new_val,此列
的
条件
是,如果为prod = 0,则new_val应来自前一行where prod = 1。如果为prod = 1,则它应该与val
列
具有相同
的
值
。如何
使用
spark sql实现这一点?2000
浏览 6
提问于2020-04-08
得票数 0
1
回答
星星之火:用另一
列
的
值
替换
缺少
的
值
、
、
假设您有一个包含一些
空
值
的
,如果存在的话,您希望将一个
列
的
值
替换
为来自另一个
列
的
值
。在Python/Pandas
中
,您可以
使用
Pandas()函数很好地完成这一任务: df = spark.createDataFrame([('a', 'b', 'c'),(None,'e', 'f&
浏览 1
提问于2017-02-09
得票数 4
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
在df的一列中 有None和Nan 我想把这些空值都填充为-1 应该怎么操作呢
一文读懂PySpark数据框
一文读懂 PySpark 数据框
一个Python大数据处理利器:PySpark入门指南
经验分享:轻轻松松让你的数据预处理提速3倍!
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券