腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
如何
从
Spark
中
的
数组
列
中
删除
元素
?
、
、
、
、
dataframe包含
数组
类型
的
列
。我正在尝试
从
列
中
删除
Seq
中
的
元素
。| |[animation, book] | 怎样才能以一种有效和优化
的
方式做到这一点呢
浏览 68
提问于2019-05-17
得票数 6
回答已采纳
2
回答
通过检查每个
元素
从
PySpark
数组
列
中
删除
重复项
、
、
、
、
我有一个包含两个
数组
列
的
Spark
dataframe:用var2
列
的
值检查
列
var1
的
每个
元素
,并从var1
中
删除
以下单词:部分(例如,1 word - tea)或完全<code>E 210</code>(例如,两个
浏览 3
提问于2022-08-01
得票数 2
回答已采纳
1
回答
在火花中处理JSON --不同文件
中
的
不同模式
、
、
我
从
第三方获得了大量
的
JSON文件。它们都有相同
的
模式,除非嵌套
元素
为空,否则它被表示为空
数组
。{ }因此,这是一个有效
的
JSON,"survey_data“
元素
是一个struct_type,但是具有非常复杂
的
嵌套结构(子
元素
比这个简化
的
示例
中
要多) 但是,当survey_data没有嵌套
元素
时,它被表示为
浏览 0
提问于2018-10-31
得票数 3
2
回答
Spark
dataframe:
从
数组
中
删除
元素
、
、
我有一个带有column1
的
Spark
dataframe:我想从这两
列
中
删除
第一个
元素
,对于column1和column2,期望
的
o/p分别是:对于column2,这里是我编写<em
浏览 2
提问于2016-08-16
得票数 0
3
回答
星星之火/Scala:
从
带有
数组
类型
列
的
DataFrame
中
删除
某些组件
、
、
/
删除
数组
列
的
某些
元素
。具体而言,每个
数组
中
的
4个
元素
对应于CS部
中
的
4个id,并以提升id顺序(意为1、5、7、101)生成数字。现在,我希望
删除
每个
数组
中
对应于in
的
元素
,这些In
的
测试列为1。我解决这个问题
的
思路包括两个步骤: 计算需要
删除</em
浏览 1
提问于2018-04-17
得票数 0
回答已采纳
1
回答
将WrappedArray拆分为多行和多
列
、
、
、
我是scala
的
新手。我正在尝试拆分WrappedArray,但没有成功。我有一个dataframe,其中包含一行我
从
xml转换而来
的
数据。00,06:00,2 Center2,57]3 2020-07-01T00:00:00 06:00 3
浏览 42
提问于2020-11-23
得票数 1
回答已采纳
2
回答
[Scala][
Spark
]:转换数据帧
中
的
列
,保留其他
列
,使用withColumn和map [错误:缺少参数类型]
、
、
、
、
---------------+------------+| Michael,Rose,|[
Spark
Java |CA ||James,,Smith |C++ |CA | .toDF(
浏览 11
提问于2021-10-11
得票数 2
1
回答
查询嵌套数据
的
spark
问题
、
有人熟悉
spark
来查询嵌套
的
数据吗?爆炸()作用是正确
的
吗?代码应该是什么样子
的
?我想查询myData-> productData (
数组
)->data(字符串) 我
的
错误代码在这里,我不确定
的
选择部分。有人能帮忙吗?非常感谢!data =
spark
.read.parquet("s3:path").filter("Btype == 'a' and marketplaceId = 1&qu
浏览 6
提问于2022-12-01
得票数 0
回答已采纳
1
回答
在
Spark
聚合期间收集唯一
元素
、
、
问题 我需要在代码
中
更新这一行。我该怎么做? "case StringType => concat_ws(",",collect_list(col(c)))" 仅追加现有字段
中
不存在
的
字符串。在本例
中
,字母"b“不会出现两次。
浏览 15
提问于2019-03-18
得票数 0
回答已采纳
1
回答
如何
将向量类型
的
VectorAssembler输出转换为
数组
、
、
spark
中
的
vectorAssembler函数提供了一个vectordouble类型作为输出,但我需要将其转换为arraydouble。我知道提供了一个内置
的
Vector_to_array函数,但我不知道
如何
将
列
转换为
数组
,一些
元素
也是稀疏
数组
。features") var transformedDF = assembler.setHandleInvalid("skip").transform(upd
浏览 31
提问于2020-12-10
得票数 0
回答已采纳
1
回答
Scala返回“不支持类型单元
的
架构”
、
我想对dataframe
中
的
列
进行更改。
列
是整数
的
数组
。我想替换
数组
的
一个
元素
,
从
另一个
数组
中
获取索引,并将该
元素
替换为来自第三个
数组
的
元素
。示例:我有三个
列
-- C1、C2、C3 --这三个
数组
。我希望按以下方式替换C3
中
的
元素<
浏览 0
提问于2018-07-02
得票数 0
回答已采纳
1
回答
如何
创建countVectorizer模型
的
一个
列
中
包含值
数组
的
火花数据
、
、
中
创建第4
列
,其中包含所有这3
列
的
值
数组
,如| indiana|需要这个
数组
,因为countVectorizer模型
的
输入应该是包含值
数组
的
列
。我试图从这3
列
输入数据创建一个
数组
,但是<em
浏览 1
提问于2017-09-05
得票数 0
回答已采纳
2
回答
将文件读取并附加到
spark
数据文件
中
我已经创建了一个空
的
dataframe,并开始添加它,通过读取每个文件。但其中一个文件
的
列
数比前一个文件多。
如何
仅为所有其他文件选择第一个文件
中
的
列
?= SparkSession.builder.\ config("
spark
.jars.packages","saurfang:
spark
-sas7bdat:2.0.0-df_
spark
=
spark</
浏览 1
提问于2019-09-06
得票数 3
回答已采纳
1
回答
如何
从
PySpark列表
中
删除
/替换字符
、
、
、
我是Python/PySpark
的
新手,目前在Databricks中使用它。" : ["191.168.192.103", "191.168.192.107"]}',),当我试着它不能正确解析JSON。结果数据帧是一个以_corrupt_record作为标题
的
列
。 查看dummyJson<
浏览 6
提问于2019-11-15
得票数 0
回答已采纳
4
回答
如何
使用array_remove
Spark
SQL内置函数
删除
空值
、
Spark
2.4引入了涉及
数组
的
新
的
有用
的
Spark
SQL函数,但当我发现:select array_remove(array(1, 2, 3, null, 3), null)
的
结果是null而不是[1, 2, 3, 3].时,我有点困惑 这是预期
的
行为吗?是否可以使用array_remove
删除
空值 顺便说一句,目前我使用
的
替代方法是databricks
中
的
高阶函数: sele
浏览 55
提问于2019-01-12
得票数 18
回答已采纳
1
回答
根据另一
列
中
数组
的
长度将
列
添加到吡火花数据
payload.links
中
包含
的
数组
在json语句中
的
大小不同。我需要将
数组
中
的
数据放入列
中
,以使dataframe看起来像: 时间戳down_dev,payload_links_1_up_db,payload_links_1_up_maker,payload_links我还知道
如何
像这样访问
数组
的
每个
元素
:
spark
_df =
spark
_d
浏览 9
提问于2022-07-21
得票数 0
回答已采纳
1
回答
将cassandra行RDD转换为元组
数组
、
、
我尝试
从
cassandra表
中
读取数据并将值存储在
数组
中
。我
的
RDD如下所示
如何
将
浏览 0
提问于2015-11-06
得票数 0
2
回答
从
pyspark
中
的
dataframe ArrayType
列
中
获取前N个
元素
、
、
我有一个
spark
数据帧,行是这样
的
-2 | [d, e, f]现在我只想保留
数组
列
中
的
前两个
元素
。1 | [a, b]3 | [g, h]注意-请记住,我在这里提取
的
不是单个
数组
元素
,而是可能包含多个
元素
的
<
浏览 1
提问于2018-10-25
得票数 12
回答已采纳
1
回答
火花
的
清洗和准备数据
、
、
、
我
从
Scala、
Spark
和MLlib开始。我想实现一个来自
的
例子 再次感谢你
的
帮助!)
浏览 14
提问于2017-04-30
得票数 1
回答已采纳
2
回答
如何
从
数组
中
删除
空散
列
、
、
如何
从
数组
中
删除
空散
列
?.compact似乎不起作用。
浏览 1
提问于2019-09-19
得票数 1
回答已采纳
点击加载更多
相关
资讯
如何使用Python从列表中删除指定的元素
Numpy第5练:不影响原数组,如何替换数组中符合条件的元素?
oracle中如何将一列中的元素按自己需要排列?
PHP去除数组中的空值元素
Python编程:如何规范numpy中数组元素的打印输出格式
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券