腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9279)
视频
沙龙
1
回答
当
Spark
Scala
数据
帧
中
的
多
列
数组
包含
彼此
对齐
的
数组
时
,
如何
分解
这些
列
?
、
、
我知道
如何
分解
数组
的
单列,但我有多个
数组
列
,
这些
数组
在索引值方面
彼此
对齐
。在我
的
dataframe
中
,
分解
每一
列
基本上只是做一个无用
的
交叉连接,导致几十个无效
的
行。因此,我将从显示
数据
开始。这显示了来自SparkNLP
的
一些结果,其中
包含
一些文本和文本<em
浏览 11
提问于2020-02-05
得票数 1
1
回答
pyspark创建一个
包含
字面值
的
数组
,然后
分解
假设我有一个
数据
帧
,如下所示df.show() 我想创建一个
包含
"source1“、"source2”、"source3“
的
数组<
浏览 0
提问于2021-09-28
得票数 0
1
回答
使用更改模式将
数据
插入到增量表
中
、
、
如何
通过改变
数据
库
中
的
模式将
数据
插入到增量表
中
。 在Databricks
Scala
中
,我
分解
了一个Map
列
并将其加载到增量表
中
。我有一个预定义
的
增量表模式。 假设模式有4
列
A、B、C、D。因此,有一天,我使用下面的代码将
包含
4
列
的
数据
帧
加载到增量表
中
。lo
浏览 18
提问于2021-10-29
得票数 0
3
回答
如何
在groupBy之后聚合映射
列
?
、
、
我需要联合两个
数据
帧
,并通过键组合
列
。这两个datafrmae具有相同
的
模式,例如:|-- id: String (nullable = true)| |-- key: string我想按"id“分组,并将"cMap”聚合在一起以进行重复
数据
删除。value) Row(
浏览 0
提问于2017-05-29
得票数 2
回答已采纳
1
回答
如何
创建countVectorizer模型
的
一个
列
中
包含
值
数组
的
火花
数据
、
、
中
创建第4
列
,其中
包含
所有这3
列
的
值
数组
,如| indiana|需要这个
数组
,因为countVectorizer模型
的
输入应该是
包含
值
数组
的
列
。我试图从这3
列
输入
数
浏览 1
提问于2017-09-05
得票数 0
回答已采纳
2
回答
当
NullType位于StructType内
时
,将空值写入
Spark
中
的
拼图
、
、
、
("collection", collectionName).load() 对于结果DataFrame
中
的
data
列
,我得到以下类型: StructType(StructField(configurationName: AnalysisException: Parquet
数据
源不支持struct 看起来问题在于我将NullType隐藏在data
列
的
类型
中
。我看
的
是How to handle null values when writ
浏览 24
提问于2021-08-11
得票数 1
1
回答
将cassandra行RDD转换为元组
数组
、
、
我尝试从cassandra表
中
读取
数据
并将值存储在
数组
中
。我
的
RDD如下所示<em
浏览 0
提问于2015-11-06
得票数 0
1
回答
AWS胶-不知道
如何
将NullType保存为红移
、
、
、
下面是AWS Glue
的
简单脚本。我有一个带有空单元格
的
文本文件和一个接受空值
的
表。当我运行胶水作业
时
,它会失败,例外情况是“不知道
如何
将NullType保存为REDSHIFT”。
如何
处理此问题,或者通过Glue在RedShift
中
不支持空插入?我没有任何空字符就重新生成了我
的
文件,我也有同样
的
问题。 我添加了这行代码。推断了一些不存在
的
NullType字段。添加了这一行代码后,插入了行,但似乎没有
包含</e
浏览 4
提问于2017-11-28
得票数 5
1
回答
使用
Scala
和
Spark
将
数组
列
的
行与另一个
数据
帧
的
标题进行比较
、
、
、
、
我用
的
是
Scala
和
Spark
。我有两个
数据
帧
。--------+| 35 | 15 | [a,b,d] |在第二个文件
中
,
数据
帧
报头是我通过添加所有可能
的
头
列
创建了一个case类。现在我想要
的
是,通过匹配
列
浏览 1
提问于2020-09-07
得票数 1
回答已采纳
2
回答
分解
Spark
Dataframe
中
的
嵌套结构
、
、
我正在处理一个
数据
帧
,看起来像这样: root |-- positions: struct (nullable = true)) | | |-- lng: double (nullable = true) 位置Struct
中
的
因此,具有精确和不精确位置
的
行应该
分解
为两行。
分解
这些</em
浏览 37
提问于2020-01-16
得票数 0
回答已采纳
2
回答
如何
在
列
数据
Spark
scala
上检查isEmpty
、
、
、
、
我
的
数据
如下所示:
如何
在
spark
sql
中
查询
时
检查col3是否为空?我试图
分解
,但当我这样做
时
,空
数组
行正在消失。有人能给我提个建议吗?result.withColumn("subscriptionProvider", explode($"subscriptionProvider
浏览 0
提问于2016-07-19
得票数 4
回答已采纳
1
回答
在
Spark
中
,根据映射表,有没有办法将字符串
数组
转换为相应
的
整数
数组
、
、
在
Spark
中
,根据映射表(String -> Integer),有没有办法将字符串
数组
转换为相应
的
整数
数组
?例如:在
Spark
中
,有5亿个
数组
, Array String 1 : ['TOM','White','Black'] Array String 2 : ['BCD','TTTT','Black']
浏览 25
提问于2019-09-02
得票数 1
1
回答
Apache
Spark
: dataframe中行值列表
的
百分比
、
、
我有一个
包含
一组计算
列
的
Apache
Spark
数据
帧
。对于
数据
帧
中
的
每一行(大约2000行),我希望获取10
列
的
行值,并定位第11
列
相对于其他10
列
的
最接近值。我想我会把
这些
行值转换成一个列表,然后使用abs值计算来确定最接近
的
值。 但是我被困在
如何
将行值转换为列表
浏览 1
提问于2017-10-03
得票数 0
1
回答
在pyspark
中
对
数据
集进行拆包
、
、
、
、
我有一个
数据
集,看起来像这样。
如何
在pyspark
中
做到这一点?
浏览 1
提问于2017-08-18
得票数 0
回答已采纳
1
回答
分解
多
列
SparkSQL
、
我们
如何
在
Spark
中
分解
多个
数组
列
?我有一个
包含
5个字符串化
数组
列
的
数据
帧
,我想在所有5
列
上进行
分解
。为了简单起见,用3
列
显示示例。col3 ["b_val1","b_val2"] ["at_val1","at_val2","at_val3"
浏览 5
提问于2020-09-08
得票数 0
回答已采纳
1
回答
如何
在Apache
Spark
中
分解
JSON
数组
、
给定一个
包含
JSON
数组
的
spark
2.3 DataFrame,我
如何
将
这些
数组
转换为JSON字符串
的
Spark
数组
?或者,等效地,我
如何
分解
JSON,以便通过以下输入:"""[{"a":1},{"b":2}]""" """
浏览 2
提问于2018-09-17
得票数 2
1
回答
Spark
Structured Streaming 2.3.0
中
的
水印
、
、
我在
Spark
Structured Streaming 2.3.0
中
读取了Kafka
的
数据
。
这些
数据
包含
了一些教师
的
信息,有teacherId,teacherName和teacherGroupsIds。TeacherGroupsIds是一个
数组
列
,其中
包含
组
的
ids。在我
的
任务
中
,我必须将具有组ids
的
列
映射
浏览 18
提问于2019-06-14
得票数 1
1
回答
如何
将WrappedArray转换为
Spark
Scala
中
的
列表?
、
、
、
、
我使用DataFrame来处理
spark
中
的
数据
。我在这个
数据
帧
中有一个
数组
列
。在我要做
的
所有转换
的
最后,我得到了一个
包含
一个
数组
列
和一行
的
dataframe。为了应用groupby、map和reduce,我想把这个
数组
作为一个列表,但我做不到。$ofRef cannot be cast to
scala
.co
浏览 33
提问于2021-04-11
得票数 0
2
回答
Spark
get嵌套对象
的
数据
类型
、
、
、
、复杂和
数组
类型值
的
混合。但是,当我尝试获取key51
的
数据
类型
时
,我得到了以下错误: ... 48 elided 我
的
主要目的是能够
分解
一个给定
的
类型,如果它
的
ArrayType,而不是任何其他类型
的
浏览 2
提问于2018-01-15
得票数 2
回答已采纳
1
回答
在matlab
中
对齐
两个
数组
、
我在matlab中有两个
数组
,用两种不同
的
方法表示跟踪点。在每个
数组
中
,第一
列
包含
帧
编号,第二
列
和第三
列
是x,y坐标。轨迹不一定在同一
帧
开始或结束,但我想比较任何常见
帧
的
轨迹之间
的
距离。我
的
输入
数据
是这样
的
:[ 130 50 20; [ 128 48
浏览 0
提问于2012-11-09
得票数 3
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Zzreal的大数据笔记-SparkDay04
划重点!12种高效Numpy&Pandas使用技巧!
机器学习之计算工具库(三)
轻松玩转Pandas(1)
用Python进行数据分析的基础姿势(一)
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券