腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
从
PySpark
DataFrame
中
删除
na
行
索引
、
我无法
删除
第一
行
。
浏览 3
提问于2020-03-12
得票数 0
回答已采纳
2
回答
使用
PySpark
移除至少具有1
NA
的任何
行
、
、
我有一个电火花数据,我想
删除
任何一
行
至少有一个
NA
。如何对
dataframe
的所有列执行相同的操作?可复制示例from
pyspark
.sql import SparkSessionfrom
pyspark
.sql.functions") \ # Initiating <em
浏览 14
提问于2022-10-05
得票数 1
回答已采纳
1
回答
如何在
Pyspark
Dataframe
中
的特定
索引
中
添加行或替换?
、
、
、
我想将此列表L1作为
行
添加到第一个
索引
中
,如何在
Pyspark
Dataframe
中
的特定
索引
中
追加一
行
?L1=['
na
',5.6,2.4] ('nr',4.4,2.5),data_schema=[StructField
浏览 30
提问于2021-01-24
得票数 0
回答已采纳
1
回答
按列值(文本)在Pandas
DataFrame
中放置
行
、
、
、
、
我希望通过使用各自的文本值
从
dataframe
中
删除
一
行
来返回新的
dataframe
。并且只保留空白(或空白)。到目前为止,我只能找到按
索引
或完整列
删除
NA
、NULLS的方法。
浏览 2
提问于2022-09-20
得票数 0
1
回答
停止patsy dmatrix
删除
NaN
行
、
我想使用patsy的dmatrix函数来生成一个设计矩阵,其中保留了带有NaN值的
行
。例如,下面的代码将返回一个四
行
的设计矩阵,这是我们通常需要的。但是,在本例
中
,我希望dmatrix返回一个有五
行
的矩阵,其中第一
行
将包含一个NaN值。import numpy as npfrom patsy import dmatrix df = pd.
DataFrame
({'x1': np.arange(5), 'x2'
浏览 3
提问于2018-08-01
得票数 1
回答已采纳
3
回答
如何使熊猫的str.contains搜索速度更快
、
、
我在400万
行
的
dataframe
中
搜索子字符串或多个子字符串。df[df.col.str.contains('Donald',case=True,
na
=False)]df[df.col.str.contains('Donald|Trump|Dump',case=True,
na
=False)]df = pd.
DataFrame
({'col
浏览 1
提问于2016-06-18
得票数 14
回答已采纳
1
回答
在
Dataframe
中
,如何根据条件
从
行
中
删除
列?
、
当该行上的列值为零时,我想从
行
中
删除
该列。我不想从
Dataframe
中
删除
该列。仅当列值为零时,我才
从
该特定
行
中
删除
该列。我用的是
Pyspark
。
浏览 19
提问于2020-04-09
得票数 0
2
回答
仅在R
中
的特定
行
索引
范围内
删除
列
中
的重复值
、
、
我有一个测试数据df,我想从它
中
删除
Hits列
中
的重复值,而不是与重复值关联的
行
。但是,条件是只有在行
索引
的某些特定范围内才能执行下降。,
NA
,
NA
, 0.001, 0.001, 0.002, 0.003, 0.003,
NA
,
NA
,
NA
, 0.023, 0.341, 0.341, 0.569), Category2 = c(
NA
,
NA
,
NA
, 1
浏览 3
提问于2022-01-03
得票数 2
回答已采纳
8
回答
跳过
索引
列
中
的
NA
行
我有一个
dataframe
,它有一个值为TRUE和
NA
的列。我想在df
中
添加一个
索引
列,它用TRUE对所有行进行
索引
,但只用
NA
跳过所有
行
,而不
删除
它们。如下所示:TRUE 1
NA
NA
TRUE 3i = 1:nrow(df) df$ID <- ifelse(df
浏览 1
提问于2020-02-18
得票数 3
7
回答
同时
删除
数据帧的第一
行
和最后一
行
,直到到达没有安娜的行为止。
、
、
、
、
我有一个包含
NA
值的
dataframe
,我希望
删除
一些具有
NA
的
行
(即不完整的情况)。但是,我只想在
dataframe
的开头和结尾
删除
行
。因此,我希望保留不位于
dataframe
的第一
行
或最后一
行
的任何具有
NA
的
行
。在不使用
行
索引
的情况下,用
NA
同时
删除
这些
行
的最有效方法是什
浏览 14
提问于2022-04-07
得票数 1
回答已采纳
3
回答
删除
最后一
行
数据帧,直到到达没有安娜的行为止。
、
、
我有一个包含
NA
值的
dataframe
,我希望
删除
一些具有
NA
的
行
(即不完整的情况)。但是,我只想
删除
数据帧末尾的
行
。因此,我希望保留任何不位于
dataframe
末尾的
NA
行
。在不使用
行
索引
的情况下,
删除
带有
NA
的结束
行
的最有效方法是什么?数据 df <- structure(list(var1 = 1:15, var2
浏览 6
提问于2022-04-05
得票数 1
回答已采纳
1
回答
如何以编程方式应用多个where条件
、
、
df = spark.createDataFrame( ('1','
NA
','9'), ('6','4','2'), ('7','N
浏览 11
提问于2021-10-19
得票数 0
2
回答
Python
dataframe
删除
前n
行
并保留moveup
、
我有一个2500
行
的数据帧。我正在尝试
删除
前n
行
,并在不更改
索引
的情况下向上移动剩余
行
。我举了一个我的问题和我想要的东西的例子 df = 10 10.512 30.514 50.516 70.5 在上面,我想
删除
顶部的两
行
,并在不干扰
索引
的情况下移动剩余的
行
。就像,一
行
代码?
浏览 124
提问于2020-04-19
得票数 1
2
回答
如果列包含Pandas
中
的任何字符串值,则从
dataframe
中
删除
值。
、
、
我希望
从
包含浮点dtype列字符串值的
dataframe
中
删除
行
。例如,如果我有一个amount字段,我希望
删除
dataframe
中
的所有
行
,这些行在amount字段
中
包含一个值"
NA
“。到目前为止我已经试过以下几种方法-data = data[~data['gross'].isin(to_dro
浏览 5
提问于2017-08-13
得票数 2
回答已采纳
1
回答
如何
从
Python中选择某些列?
、
、
、
、
我试图只
从
dataframe
中选择某些列,
删除
na
行
。我还应该在
删除
行
后重置
行
索引
。HousingData.select("CRIM").show("CRIM")干杯!
浏览 4
提问于2022-10-09
得票数 -1
回答已采纳
2
回答
如何在Pandas中选择丢失数据超过一定数量的
行
/列?
、
我正在尝试学习如何选择丢失数据超过一定数量的
行
或列。使用value_counts,我可以找到满足条件的列,但是我不知道如何检索int形式的
索引
,以便可以访问数据帧并从数据帧
中
删除
相应的列。如何在int中转换/检索
索引
?还有,有没有更简单的方法来做到这一点呢?df3 = pandas.
DataFrame
([[1,6.5,3],[1,'
NA
','
NA
'],[3,'
NA
'
浏览 3
提问于2016-11-17
得票数 2
3
回答
对于每一
行
,如何返回
索引
,使在此
索引
之后不存在
na
?
、
、
T1 T2 T3 T4 T5 1 1
NA
1
NA
1 1
NA
1
NA
所以第一
行
的结果应该是
从
T1到T2 (
索引
1到index2)。第2
行
的结果应该是T3 - T5,第3
行<
浏览 9
提问于2022-11-19
得票数 -1
1
回答
为什么我得到了TypeError:不能在使用_thread.RLock时选择'_thread.RLock‘对象
、
、
、
、
, 1)文件"/private/var/www/http/hawk-scripts/hawk_etl/scripts/spark_rds_to_parquet.py",第46
行
,在process() "/private/var/www/http/hawk-scripts/hawk_etl/scripts/spark_rds_to_parq
浏览 2
提问于2022-05-11
得票数 0
回答已采纳
1
回答
从
星星之火数据
中
的列表中提取值,而不转换为熊猫
、
、
我非常绿色的火花,所以我把它转换成一个熊猫
DataFrame
,然后使用地图功能,我提取所需的元素。问题是,数据是巨大的,因此这种方法是不可扩展的。让我花时间的是toPandas()命令。是否有
从
每一
行
访问列表
中
的值的选项? 谢谢!
浏览 5
提问于2021-12-09
得票数 1
回答已采纳
1
回答
Pyspark
-> StringIndexer:用数字替换“无”值
、
(self.rawData, columnName) @staticmethod indexer = indexer.fit(
dataFrame
)
dataFrame
= indexer.transform(<
浏览 1
提问于2018-04-29
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
云直播
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券