腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
重命名
Pyspark
Dataframe
中
未命名
的
列
、
表
的
标题已经在前两行中进行了某种程度上
的
拆分。我该怎么解决这个问题呢?有没有什么解决方案可以将每一
列
的
两个名称
中
的
最好
的
一个作为标题,并将该
列
的
名称作为标题 我在源文件中有以下行: |Unnamed:_0|Unnamed:_1|Unnamed:_2|Unnamed:_3|Year |2018|2018.1| |Col1 |Col2 |Col3 |Col4 |Col5 |Month|Ju
浏览 37
提问于2021-11-16
得票数 1
1
回答
熊猫
重命名
多个NaN列名
、
、
在读取csv文件时,我
的
dataframe
有以下列名:Index([nan,"A", nan, "B", "C", nan],dtype='object') 由于未知
的
原因,它不会像通常那样自动将它们命名为因此,是否可以将多个nan
列
重命名
为
未命名
的
:0、
未命名
的
:1等等,这取决于有多少nan
列
-- nan
浏览 2
提问于2020-05-20
得票数 1
回答已采纳
1
回答
向类添加功能
的
最佳方法-
PySpark
、
、
、
、
有一段时间,我在寻找如何将多个
列
一次
重命名
为一个
PySpark
DF,并遇到了如下情况:def rename_sdf(df, mapper={}, **kwargs_mapper,其中通过赋值语句将方法添加到
pyspark
.
DataFrame
类
中
。问题是,我正在创建一个Github来存储我
的
所有函数和ETL,我认为如果我能够应用上面显示
的
逻辑,就可以非常容易地创建一个__init__.py模块,在其中实
浏览 6
提问于2020-07-09
得票数 1
1
回答
从火花数据中选择或删除重复列
、
、
、
给定一个星星之火数据,有一个重复
的
列名(例如。( A)对于不能修改上游或源
的
,如何选择、删除或
重命名
其中
的
一个
列
,以便检索
列
值?df.select('A')向我显示了一个不明确
的
列
错误,filter、drop和withColumnRenamed也是如此。如何选择其中一
列
?
浏览 0
提问于2018-09-06
得票数 2
2
回答
DynamicFrames上
的
AWS Glue多
列
重命名
= "COL1")我尝试了几个变体,并基于其他
的
Glue
浏览 2
提问于2018-08-01
得票数 0
3
回答
我可以将pandas数据帧转换为spark rdd吗?
Pbm: a)读取一个本地文件到Panda
dataframe
中
,比如PD_DF。b)操纵/海量PD_DF并添加列到
dataframe
中
。c)需要使用spark将PD_DF写到HDFS。
浏览 0
提问于2015-04-15
得票数 4
3
回答
如何使withColumnRenamed查询泛化
、
、
curentColumnName2','currentColumnName3']它们是包含所有
列
的
dataframe
df。我想要检查是否在
dataframe
中
存在
列
'curentColumnName1,如果是,那么将其
重命名
为newColumnName
浏览 1
提问于2022-08-18
得票数 0
2
回答
如何按索引
重命名
PySpark
数据栏?(处理重复
的
列名)
、
、
、
我有一个问题,我需要动态更新星火数据
中
的
列
。def dup_cols(df): for x, xcol in enumerate(df.columns= x: df = df.withColumnsRename
浏览 0
提问于2018-12-13
得票数 5
回答已采纳
1
回答
Pyspark
数据框架操作
的
单元测试用例
、
、
、
我已经用python写了一些带有sql上下文
的
代码,即
pyspark
,通过将csv转换为
pyspark
dataframe
来对csv执行一些操作(df操作,如预处理、
重命名
列名、创建新
列
并将其附加到相同
的
dataframe
中等)。我没有在数据帧上编写单元测试用例
的
想法。有谁能帮我在
pyspark
的
dataframe
上写单元测试用例吗?或者给我一些数据帧上
的
测试用例
浏览 1
提问于2016-04-14
得票数 3
1
回答
用年份标签
重命名
几个
列
,而不重复逻辑
、
、
、
、
除了一个数字之外,我
的
dataframe
中有几个
列
未命名
。在这种情况下,列编号为50到59。我想用年份标签
重命名
这些
列
,即第50
列
将
重命名
为'2006',第51
列
将
重命名
为'2007',依此类推。我有下面的代码来
重命名
这些
列
,这是可行
的
,但就我所要做
的
输入量而言,它似乎过于重复: GDP.rename(co
浏览 0
提问于2018-04-22
得票数 0
回答已采纳
2
回答
如何引用Pandas
中
查询字符串
中
的
未命名
列?
、
、
使用
DataFrame
时,如何引用查询字符串
中
未命名
的
pandas.
DataFrame
.query
列
?我知道我可以在后面包围那些无效
的
Python变量名
的
列名。但是,这并不涉及
未命名
的
列
。例如,我想查询
DataFrame
中
的
所有行,其中
未命名
的
列
包含大于0.5
的
值。我
浏览 3
提问于2021-07-09
得票数 2
2
回答
未命名
栏-
重命名
-熊猫
、
、
我正在尝试
重命名
数据帧
中
未命名
的
列
。该
列
中
第1行
的
值将成为该
列
的
名称。如果
列
不包含
未命名
的
名称,则其名称应保持不变。我试图以这样
的
方式实现它: if 'Unnamed' in col:
浏览 4
提问于2022-03-02
得票数 1
回答已采纳
2
回答
使用scala
重命名
一个数据帧相对于另一个数据帧
的
列名
、
、
我正在尝试
重命名
基于另一个数据帧
的
数据框
的
列
。如何使用Scala实现这一点?基本上,我
的
数据看起来像这样1 2 3 4Col1 Col2B QD Z 我想相对于其他数据帧
重命名
我
的
第一个数据帧
的
列
。因此,预期输出应
浏览 7
提问于2018-01-14
得票数 0
回答已采纳
1
回答
如何在字典中正确使用reduce
、
、
、
我正在使用一个自定义函数作为reduce操作
的
一部分。对于下面的例子,我得到了下面的消息TypeError: reduce() takes no keyword arguments -我相信这是由于我在函数exposed_colum中使用字典mapping
的
方式from
pyspark
.sql import
DataFrame
, Rowfrom
pyspark
.sql importSparkSession fr
浏览 18
提问于2020-02-05
得票数 0
回答已采纳
3
回答
熊猫改名栏
、
、
我试图用前面的列名
重命名
我
的
列
,最后加上一个数字,以使
列
唯一。有办法做到这一点吗?
浏览 3
提问于2021-05-27
得票数 3
回答已采纳
1
回答
Pyspark
:读取paquet文件时出错
、
、
我正在尝试使用以下命令通过
pyspark
读取拼图文件:拼图文件
中
的
列
具有空格因此,我尝试使用以下命令
重命名
这些
列
: file = file.withColumnRenamed(c, c.replace(" ", ""
浏览 4
提问于2020-12-08
得票数 0
1
回答
PySpark
将
列
拆分到具有应用架构
的
新数据帧
、
、
、
如何通过逗号将字符串列拆分为具有应用模式
的
新数据帧?作为示例,下面是一个包含两
列
(id和value)
的
pyspark
DataFrame
df = sc.parallelize([(1, "200,201,hello"), (2, "23,24,hi")]).toDF(["id", "value"]) 我希望获取value
列
并将其拆分到一个新
的
DataFrame
中<
浏览 18
提问于2021-11-10
得票数 1
1
回答
如何在不将
列
列表临时存储到变量
中
的
情况下
重命名
df
列
?
、
、
、
我正在提取Snowflake表并将其加载到
PySpark
DataFrame
中
,并且我想
重命名
它
的
列
。现在,正在将加载
的
数据帧存储到一个变量
中
,然后访问
列
列表: spark.read.format("snowflake")我想到
的
第二种方法是预先
浏览 1
提问于2021-04-21
得票数 0
1
回答
使用
Pyspark
动态
重命名
dataframe
列
、
、
我正在读一个文件,其中
的
列
可以是结构,当它们有一个值,或者当没有数据时,可以是字符串。内联示例assigned_to和group是结构化
的
,具有数据。".display_value") df23 = df23.withColumn(name+"_value", lit(None)) 现在,如果我必须使用val_cols4从
dataframe
df23
中
进行选择,那么所有结构
列
都具有相同
的
名称"di
浏览 24
提问于2021-04-27
得票数 1
回答已采纳
4
回答
动态
重命名
PySpark
DataFrame
中
的
多
列
、
、
、
我有一个数据火花,其中有15
列
。现在,我想将其中包含'.'
的
列名替换为'_'我想动态地做它。 我怎样才能在火星雨中实现这一点呢?
浏览 4
提问于2017-01-14
得票数 17
回答已采纳
点击加载更多
相关
资讯
如何对 dataframe中的某一列数据 开根号呢?
Python使用DataFrame打印指定列的方法
PySaprk之DataFrame
Python开源数据分析工具TOP 3!
一个Python大数据处理利器:PySpark入门指南
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券