腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
如何
删除
pyspark
中
具有
超过
x
个
空
值
的
行
、
我在
删除
数据帧
中
超过
空
值
na_threshold
的
行时遇到了一些问题当我跑
的
时候 df_null = df3.where(reduce(lambda
x
, y:
x
| y, (f.col(
x
).isNull() for
x
in df3.columns))
浏览 9
提问于2019-11-19
得票数 0
回答已采纳
2
回答
如何
删除
具有
超过
x
个
空
值
的
数据帧
中
的
行
?
、
、
、
我正在尝试
删除
数据帧中有
超过
7
个
null
值
的
行
。请提出一些有效
的
措施来实现这一目标。
浏览 0
提问于2018-12-04
得票数 8
回答已采纳
1
回答
VBA:从
具有
超过
X
的
空
值
的
数组
中
删除
行
、
、
、
、
我有一
个
动态数组(n,m),它获取从一
个
范围分配
的
值
。 Dim CFar
浏览 2
提问于2019-03-22
得票数 0
回答已采纳
6
回答
如何
删除
单列
pyspark
中
包含
空
值
的
行
、
、
我有一
个
数据帧,我想
删除
其中一列(字符串)
中
具有
空
值
的
所有
行
。我可以很容易地得到它
的
计数: df.filter(df.col_
X
.isNull()).count() 我尝试使用下面的命令
删除
它。它会执行,但计数仍为正数 df.filter(df.col_
X
.isNull()).drop() 我尝试了不同
的
尝试,但它返回'object is not callable‘错误。
浏览 100
提问于2017-05-24
得票数 24
回答已采纳
1
回答
检查列是否全部为
空
、
、
我有一
个
列名和一
个
数据帧。我想检查该列
中
的
所有
值
是否都为
空
,如果为
空
,则从数据帧
中
删除
该列。我所做
的
是检查
具有
非
空
值
的
列
的
计数,如果count等于0,则
删除
该列,但在
pyspark
中
这似乎是一
个
开销很大
的
操作
浏览 0
提问于2019-08-09
得票数 0
2
回答
如何
在
pyspark
dataframe
中
返回空
值
的
行
?
、
、
我正在尝试从
pyspark
dataframe
中
获取
空
值
的
行
。在pandas
中
,我可以在数据帧上使用isnull()来实现这一点:但在
PySpark
的
情况下,当我运行以下命令时,它显示Attributeerror
如何
在不对每一列进行检查
的
情况下获取
具有
空
值
的
行
?
浏览 25
提问于2018-11-27
得票数 5
1
回答
使用databricks python代码
删除
azure帐户
中
的
文件
、
、
如何
在databricks
中
编写
pyspark
/python代码以
删除
在azure存储帐户
中
超过
X
天
的
文件。
浏览 5
提问于2022-04-21
得票数 0
3
回答
如何
在
Pyspark
中
替换dataframe
的
所有空
值
、
、
我在
pyspark
中有一
个
超过
300列
的
数据框架。在这些列
中
,有一些列
的
值
为null。_2null null125 124and so on 当我想对column_1求和时,我得到
的
结果是一
个
空
值
现在,我想用空格替换数据框所有列
中
的
null。所以当我尝试对这些
浏览 1
提问于2017-02-18
得票数 56
回答已采纳
1
回答
如何
将所有的日期格式转换为日期列
的
时间戳?
、
、
、
我使用
的
是
PySpark
版本3.0.1。我正在将csv文件读取为
具有
2
个
日期列
的
PySpark
数据帧。但是,当我尝试打印模式时,两列都被填充为字符串类型。 ? ? 上面附加
的
屏幕截图是Dataframe和Dataframe模式。
如何
使用
pyspark
将date列
中
的
行
值
转换为时间戳格式?我已经尝试了很多东西,但所有的代码都需要当前
的</em
浏览 16
提问于2020-12-30
得票数 2
2
回答
在火花中放置
行
如何
根据行号/
行
索引
值
的
值
删除
Pyspark
中
的
行
值
? 我对
Pyspark
(和编码)很陌生--我尝试过编码一些东西,但是它不起作用。
浏览 1
提问于2019-04-08
得票数 3
回答已采纳
1
回答
从单个列
中
的
Pyspark
Dataframe
中
删除
空
值
、
、
、
我有一
个
这样
的
pyspark
数据帧: +--------------------+--------------------+ | name|47| | null| pizza| +--------------------+--------------------+ 我想从每个单独
的
列
中
删除
空
值
,以便非
空
数据排成一
行
。|
浏览 7
提问于2020-06-16
得票数 1
2
回答
如何
使用基于HDFS
的
Spark进行数据清理
、
、
、
、
目前,我主要研究
的
是数据挖掘项目中
的
数据预处理。具体来说,我想使用基于HDFS
的
PySpark
进行数据清理。我对这些东西很陌生,所以我想问问怎么做?例如,HDFS中有一
个
包含以下条目的表:1 a abc 04 b abc 15 a abc
浏览 4
提问于2017-02-19
得票数 2
回答已采纳
2
回答
删除
最小
值
、最大
值
和计算平均值
、
我有一列数字,我只需要
删除
一分钟。最多一次。然后计算剩余数字
的
平均值。问题是,最小/最大
值
可能在列
中
的
任何位置,并且某些
行
可能为
空
(null)或
具有
零,或者该列可能只有3
个
值
。30.5 D30.5 A56 D 64.2 H 如果存在多个min或max,则只能
删除
一
浏览 59
提问于2021-04-06
得票数 4
回答已采纳
2
回答
TextPad不使用任何内容替换字符和换行符
、
如何
将TextPad '
中
的
行
替换为
空
(即:
删除
只有一
个
字符
的
行
)?这个电子表格中有
超过
90,000
行
的
数据在列B
中
。有
超过
一百万行在列A
中
只有一
个
单引号,因为我对该列执行了"Ctrl+D“操作,将该列
中
的
值
(单引号)向下复制到所有<em
浏览 10
提问于2017-07-13
得票数 0
1
回答
移除下一列
中
的
空
值
和移位
值
我需要将Python脚本转换为
Pyspark
,这对我来说是一项艰巨
的
任务。ROW_2 2 | pig | null | cat | null 我
的
目标是cow | frog | d
浏览 2
提问于2020-08-10
得票数 2
回答已采纳
2
回答
如何
删除
带有重复
值
的
行
,但包含
空
值
的
行
除外?
、
、
我想使用power查询
删除
包含电子邮件地址
的
列
中
具有
重复
值
的
行
。但我不希望
删除
具有
重复
空
值
或重复
空
单元格
的
行
。 我该
如何
做到这一点?
浏览 4
提问于2017-05-18
得票数 0
回答已采纳
1
回答
删除
阈值编号为null
的
列
、
、
有一
个
数据集,并希望使用
pyspark
进行一些清理。
删除
空
值
大于75%
的
所有列。使用python:
如何
使用
pyspark
实现这一点?
浏览 0
提问于2019-05-14
得票数 0
2
回答
删除
特定列
的
空
值
行
,同时在
pyspark
中
执行partitionBy列
、
、
、
、
我有一
个
这样
的
电火花数据仓库:| id| name|state||111| null| CT||222|name2| CT||333|name4| CT|+---+-----+-----+ 对于给定
的
ID,即使列" name“是
空
的
(如果它
的
ID不重复),但如果ID是重复
的</
浏览 1
提问于2020-05-06
得票数 1
回答已采纳
2
回答
如何
键入星火DataFrame列?使用火花放电
、
我以以下方式创建了一
个
DataFrame:spark = SparkSession \root |-- Survived: string (nullable = true) |-- Cabin: string (nullable = true) |-- Emba
浏览 3
提问于2018-10-18
得票数 0
回答已采纳
2
回答
如果一列
中
的
值
超过
某一
值
,则在2列
中
删除
所有
行
。
、
、
、
我有两
个
专栏“感情”和“推特”。感情包含数字,推特串。我有一
个
带有这两列
的
dataframe。现在,我想
删除
推特长度
超过
150
个
字母
的
所有
行
。我可以通过以下方式
删除
X
中
的
值
:
X
=[
x
for
x
in
X
浏览 2
提问于2017-05-17
得票数 1
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
云直播
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券