腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
使用
用户
定义
的
值
在
dataframe
中
添加
新
列
。(
火花
源
)
、
、
从某个函数获取
的
数组A1
的
三个
值
-A1 = [5,6,7,8]我
的
dataframe
,我想在其中
添加
一个包含数组
值
的
新
列
-+---+---+-----+| 2| B|-23.0|+---+---+-----+ 我试过这样(假设'df‘是我
的<
浏览 5
提问于2018-01-23
得票数 0
回答已采纳
1
回答
重新排序
源
列
,以匹配PySpark
中
目标数据
的
顺序
、
、
我
在
目标表中有一个固定
的
火花
DataFrame
订单:
源
(col3字符串、如何
使用
DataFrame
重新排列
源
DataFrame
以匹配目标
DataFrame
的
列
顺序?
源
应该重新排序,如下所示,以匹配目标
浏览 0
提问于2019-06-27
得票数 0
回答已采纳
1
回答
将聚合
列
添加
到星火
DataFrame
、
、
我有一个星火
DataFrame
,看起来像:|----+-------+-----|| 2 | 2.6 |1 || 4 | 9.6 | 2 | 我有一个函数f,它接受一个
值
数组并返回一个数字。我想在上面的数据框架
中
添加
一个
列
,其中每一行
中
的
新
列
的
值
是具有相
浏览 3
提问于2015-05-28
得票数 2
回答已采纳
1
回答
应用于星火
DataFrame
多
列
转换
的
优化方法
、
、
在
我
的
火花
作业
中
,我必须对两个用例
在
多列上进行转换: ListOfCol.foldLeft(
dataFrame
) {
浏览 6
提问于2021-11-01
得票数 0
2
回答
包含Spark
Dataframe
中
的
列表
值
的
级联
列
、
、
、
、
我有一个
dataframe
(
火花
),它有两个
列
,每个
列
都有列表
值
。我想要创建一个
新
列
,它连接这2
列
(以及
列
中
的
列表
值
)。例如:
列
2有一个行
值
- C,D具有行
值
的
浏览 0
提问于2018-03-20
得票数 2
回答已采纳
1
回答
从多
列
DataFrame
中
火花
批写卡夫卡主题
、
、
批处理之后,我需要向Kafka主题写入包含多个不同
列
的
结果
DataFrame
。根据下面的
火花
文档,写入Kafka
的
Dataframe
在
模式
中
应该有以下强制
列
: 正如我前面提到
的
,我有更多
的
列有
值
,所以我有一个问题--如何正确地将整个
DataFrame
行作为一条消息从我
的
Spark应用程序发送到K
浏览 0
提问于2018-11-23
得票数 0
回答已采纳
1
回答
识别pyspark
中
列
值
的
第一次出现,然后根据它增加另一
列
。
当我
在
火花
放电
中
遇到一个
新
的
客户id时,我正试图增加一个
列
-pyspark.sql.
dataframe
.
DataFrame
类型,它有2
列
Customer_id 101 101010101010101010103,每当一个
新
的
Customer_ID标志
值
被重置为1时,当遇到相同
的
id时增加。
浏览 2
提问于2020-04-05
得票数 1
回答已采纳
1
回答
火花
结构化流作业如何处理流-静态
DataFrame
连接?
、
、
、
我有一个
火花
结构化流作业,它从cassandra和deltalake读取映射表,并加入流df。我想了解这里的确切机制。星火是否击中了这些数据来源(卡桑德拉和德尔塔雷克)
的
每一个周期
的
微批?如果是这样的话,我
在
spark中看到这些表只读取一次。请帮我理解一下。提前感谢
浏览 2
提问于2020-12-02
得票数 1
回答已采纳
2
回答
以编程方式将几个
列
添加
到星火
DataFrame
、
、
、
、
我用
的
是斯卡拉
的
火花
。 我有一个有3
列
的
Dataframe
: ID、Time、RawHexdata。我有一个
用户
定义
的
函数,它接受RawHexData并将其扩展为X
列
。重要
的
是要声明,对于每一行X都是相同
的
(
列
没有变化)。但是,
在
收到第一个数据之前,我不知道
列
是什么。但一旦我有了头脑,我就能推断出来。我想要包含上述
列<
浏览 5
提问于2015-09-15
得票数 3
回答已采纳
1
回答
将StringType
列
添加
到现有的
DataFrame
中
,然后应用默认
值
、
、
、
Scala2.10在这里
使用
Spark1.6.2。我有一个与类似的(但不是相同
的
)问题,然而,被接受
的
答案不是,它假定了关于
火花
的
某种“预先知识”;因此我无法复制它或理解它。(更重要
的
是,),这个问题也仅限于向现有的
dataframe
中
添加
一个
新
列
,而我需要
添加
一个
列
以及数据中所有现有行
的
值
。因此,我希望向现有的
Data
浏览 4
提问于2016-10-10
得票数 7
回答已采纳
10
回答
如何将
新
列
添加
到星火
DataFrame
(
使用
PySpark)?
、
、
、
、
我有一个
火花
DataFrame
(
使用
PySpark 1.5.1),并希望
添加
一个
新
的
列
。我尝试过以下几种方法,但都没有成功: my_df_spark.withColumn("
浏览 13
提问于2015-11-12
得票数 179
回答已采纳
1
回答
用吡
火花
修改蜂箱表后
的
模式错误
、
、
、
我
在
单元格中有一个名为test
的
表,其中列为id和name现在,我想比较这两个表
的
模式,并将
列
差异
添加
到test表
中
。
在
完成所有这些操作之后,hive表test将
添加
新
的
列
city,并按照预期
添加
空
值
。 现在,当我关闭
火花
会话并打开一个
新</
浏览 4
提问于2017-03-23
得票数 2
回答已采纳
2
回答
列
的
值
为null,并在中进行交换。
、
、
、
、
我正在
使用
pyspark==2.3.1。我用熊猫对数据进行了数据预处理,现在我想把我
的
预处理功能转换成熊猫
的
火花
放电。但是,当
使用
pyspark读取数据CSV文件时,许多值将变为空
列
,而该
列
实际上有一些
值
。如果我试图对这个
dataframe
执行任何操作,那么它将与其他
列
交换
列
的
值
。我也尝试过不同版本
的
火花
放电。谢谢 来源于<em
浏览 5
提问于2022-02-16
得票数 0
回答已采纳
1
回答
将常数值
添加
到Spark
dataframe
中
的
列
中
、
、
我有一个
火花
数据框架,如下所示1 naveen 24id personage有人能帮助我如何
使用
Scala
在
Spark
中
实现这一点吗?
浏览 1
提问于2016-12-28
得票数 2
回答已采纳
1
回答
如何将
值
列表作为
新
列
添加
到现有的
Dataframe
中
?
、
、
我有一个像这样
的
Pyspark:| col1|col2|| Apple| A||Facebook| F|我有一个
值
为"SFO“、"LA”、"NYC“
的
数组。我希望将这个数组作为
新
列
添加
到
Dataframe
中
,如下所示: #+--------+----+----------
浏览 2
提问于2020-04-18
得票数 1
回答已采纳
4
回答
如何将
列
家族从一个cassandra集群复制到另一个集群?
、
、
、
如何将一个
列
族从一个卡桑德拉集群复制到另一个? 最优先考虑
的
是,我希望
使用
火花
卡桑德拉连接器JAVA
在
单个/多个
火花
作业(中间创建
DataFrame
,然后保存它)
中
完成这个任务。中度优先
使用</
浏览 2
提问于2015-09-06
得票数 1
1
回答
当我需要持久化数据格式时
、
、
我很想知道什么时候我需要坚持我
的
数据
在
火花
和什么时候不。个案:- 如果我需要文件
中
的
数据(我需要持久化它吗?)因为据我所知,它应该在第一次计数后将df存储在内存
中
,
在
第二次计数中
使用
相同
的
df。文件
中
的
记录是4,因为当我实际检查它时,它会一次又一次地读取文件,那么为什么spark不将它存储在内存
中
?第二个问题是
火花
阅读是一个动作或transformation?
浏览 0
提问于2020-08-12
得票数 0
回答已采纳
1
回答
如果Pyspark
中
没有
列
的
值
,如何将
值
增加一个
、
、
我有下面的电
火花
数据columns = ["id","name"]id name esd
浏览 2
提问于2022-05-23
得票数 0
1
回答
从数组
列
的
所有组合
中
触发数据
、
、
假设我有一个星火
DataFrame
d1,它有两个
列
elements_1和elements_2,它们包含一组大小为k
的
整数,以及包含整数值
的
value_1,value_2。例如,
使用
k = 3+------------+------------++-------------------------+4, 5) || (4, 3, 1) | (3, 5, 6) | +----
浏览 6
提问于2020-11-11
得票数 1
回答已采纳
1
回答
根据列表
的
长度与
dataframe
的
行数相同
的
列表,生成
列
。
、
、
、
我有一个现有的,它有170
列
和841行。我想
添加
另一
列
,这是一个‘字符串’
的
列表。其中一种方法可以是创建一个
新
的
dataframe
并将其与主
dataframe
连接起来。而且它不能连接到原始
的
dataframe
,因为没有可连接
的
公共
列
。 我能想到
的
另一个半生不熟
的
方法是
使用
文字。array<array<string&g
浏览 2
提问于2017-07-20
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券