腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9925)
视频
沙龙
1
回答
pyspark
dataframe
拆分
动态
列
、
、
Auto202012101237.TXT")data2 = data21.filter(~col("_c0").contains(header2)) 这会产生一个只有_c0
列
的好文件因此,欧洲版本的
列
从_c0到_c980 (或者更少,取决于型号)。我正在寻找一种方法来将这个data2分成多个
列
,用.split找到了几个解决方案,其中大部分是硬编码的,从pos1-5= field1,6-xx = field2。我想找到一个指令,它遍历整个行并创建到_cXX
浏览 13
提问于2021-01-21
得票数 0
1
回答
使用map函数将Spark
Dataframe
转换为RDD
、
、
我正在尝试将spark数据框中的
列
拆分
为多个值。因此,我分隔了要
拆分
的
列
,并检查了其类型:O:
pyspark
.sql.
dataframe
.
DataFrame
O:
pyspark
.rdd.PipelinedRDD万分感谢
浏览 0
提问于2016-06-22
得票数 0
1
回答
在
pyspark
数据帧中用数字替换字符串
、
我刚接触
pyspark
,我想在
pyspark
dataframe
列
中
动态
地用数字替换名称,因为我的
dataframe
中有超过500,000个名称。如何继续?
浏览 9
提问于2019-07-25
得票数 0
1
回答
动态
列
.withColumn Python
DataFrame
、
、
、
、
我想在我的星火
DataFrame
上
动态
地应用. list中的列名。from
pyspark
.sql.functions import col return [x for x in
dataframe
.columns if get_dtype(
dataframe
,x)=='tinyi
浏览 3
提问于2020-04-21
得票数 1
回答已采纳
1
回答
PySpark
将
列
拆分
到具有应用架构的新数据帧
、
、
、
如何通过逗号将字符串列
拆分
为具有应用模式的新数据帧?作为示例,下面是一个包含两
列
(id和value)的
pyspark
DataFrame
df = sc.parallelize([(1, "200,201,hello"), (2, "23,24,hi")]).toDF(["id", "value"]) 我希望获取value
列
并将其
拆分
到一个新的
DataFrame
中,并应用以下模式: from
浏览 18
提问于2021-11-10
得票数 1
1
回答
在CSV文件中处理JSON对象并保存到
PySpark
DataFrame
、
、
、
、
如果我尝试将文件读取为CSV,那么JSON对象将在其他
列
中重叠。Test_File.pyfrom
pyspark
浏览 2
提问于2020-09-23
得票数 1
1
回答
如何在
pyspark
中使用pandas_udf
拆分
dataframe
中的字符串
、
、
我只有一
列
的
dataframe
。我想使用
pyspark
中的pandas_udf
拆分
字符串。因此,我有以下代码: from
pyspark
.sql.functions import pandas_udf, PandasUDFType def split_msg
浏览 17
提问于2019-10-03
得票数 0
回答已采纳
1
回答
PySpark
DataFrame
拆分
结构数组
列
、
假设我对这个
列
进行了排序,我想将它分成两
列
,其中第一
列
只包含每个第一个元素。第二
列
包含每二个元素。这个是可能的吗?如果我有[[1,11], [2,22], [3,33]],那么我想把它分成[1,2,3]和[11,22,33] 我在api
列
中查找,但什么也找不到。它实际上不是一个结构,我将列表元组转换为DF。
浏览 7
提问于2022-11-17
得票数 0
1
回答
动态
地在多个列上操作
、
、
、
在
pyspark
中,假设我有名为'a1','a2','a3'...'a99'的
列
的
dataframe
,如何对每个
列
应用操作来
动态
创建具有新名称的新
列
?例如,获取新
列
(如sum('a1') as 'total_a1' , ... sum('a99') as 'total_a99' )。
浏览 0
提问于2019-02-28
得票数 1
3
回答
将行中的每一
列
传递给Spark中的哈希函数
、
、
、
我有一个带有N
列
的表,我想将它们连接到一个string
列
中,然后在该列上执行一个散
列
。
浏览 1
提问于2018-11-26
得票数 1
回答已采纳
1
回答
如何在
Pyspark
Dataframe
中训练和测试
拆分
的时间序列数据
、
、
、
我想对排序后的
Pyspark
数据帧进行基于时间的训练测试
拆分
。假设前300行将在训练集中,下200行将在测试
拆分
中。我可以用以下命令选择前300行: train = df.show(300) 但是如何从
Pyspark
dataframe
中选择最后200行呢?
浏览 14
提问于2019-03-13
得票数 1
4
回答
如何使用
PySpark
将向量
拆分
为
列
、
、
、
、
上下文:I有一个包含2
列
的
DataFrame
:word和vector。其中,“向量”的
列
类型为VectorUDT。问题:提前感谢
浏览 10
提问于2016-07-14
得票数 68
回答已采纳
1
回答
用电火花将稠密向量转换成数据
、
、
、
我正试图将密集向量转换为
dataframe
(最好是星火),并附带列名并遇到问题。 我在中的
列
是使用创建的一个向量,现在我想将它转换回一个
dataframe
,因为我想在向量中的一些变量上创建图。转换为Pandas
dataframe
,之后我无法将值
拆分
为不同的
列
。,但是我的
dataframe
中仍然只有一个
列
,所有的值都用逗号分隔为一个列表。它只有一
列
all_features。我正在尝试创建一个将所有这些值分割成单独
列
浏览 0
提问于2018-09-27
得票数 3
回答已采纳
3
回答
pyspark
:将字符串转换为结构
、
、
、
、
1581534117303\"}", "LastUpdatedBy": "System"使用aws glue,我想要将"Properties“
列
关联起来将其转换为struct,可能会基于阅读此博客- <bound method
DataFrame
.show of
DataFrame
[Id: string, LastUpda
浏览 2
提问于2020-02-19
得票数 2
2
回答
将吡火花数据转换为
动态
数据
、
、
我能够通过persons.toDF()将
动态
数据转换为触发数据。我想把火花数据再一次转换回
pyspark
.I中的
dataframe
,我想将我的
列
转换为Time戳,然后再将它转换为
dataframe
到resolveChoices。请帮帮我
浏览 2
提问于2019-09-24
得票数 2
2
回答
如何
拆分
dataframe
列
值,并将前两个字符串仅取到新
列
、
我在
dataframe
中有一个
列
,它的字符串值如下"Software part not present"nullnull null null
浏览 5
提问于2022-09-30
得票数 0
1
回答
PySpark
使用另一
列
中的值查询一个列名
、
、
、
、
Input_
pyspark
_
dataframe
:111777 454output_
pyspark
_
dataframe
333 ccc 1 300 444 ddd
浏览 0
提问于2020-08-20
得票数 0
1
回答
基于火花放电的整列计算统计量
、
、
我试图使用
PySpark
注释将一个发行版安装到整个pandas_udf
列
中。from
pyspark
.sql import Rowimport numpy as nprdd = sc.parallelize(l) rdd2
浏览 0
提问于2018-02-15
得票数 0
回答已采纳
1
回答
分裂火花放电数据柱
、
我有下面的
pyspark
dataframe
列
。weekly_trend_navigatorday_of_month_trend_notifierunique_notifier 我必须
拆分
上面的
列
浏览 2
提问于2021-10-28
得票数 0
回答已采纳
2
回答
拆分
pyspark
dataframe
中的Array
列
、
、
、
、
_c2, a3_b3_c3] [aaa2_bbb2_ccc1, aaa2_bbb2_cc2, aaa3_bbb3] 现在我想
拆分
元素
浏览 66
提问于2021-07-29
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python使用DataFrame打印指定列的方法
如何对 dataframe中的某一列数据 开根号呢?
Python按一列拆分Excel表格
Excel–如何将一列数据隔行拆分成两列?
PySaprk之DataFrame
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券