腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
从
Spark
Dataframe
的
ArrayType
列
中
删除
Scala
中
的
空
列表
、
、
我在
dataframe
中有一个类型为
ArrayType
的
列
。目前,在本专栏
中
,我有空
的
列表
。例如: +-------++-------+|[] ||xyz||[a] | +-------+ 我如何在加入这个专栏
的<
浏览 41
提问于2021-10-21
得票数 1
1
回答
Spark
dataframe
中
ListType、MapType、StructType字段
的
通用处理
、
、
如何在
Scala
中
对
Spark
StructType执行通用处理,如按名称选择字段、遍历映射/
列表
字段等?在
spark
dataframe
中
,我有类型为"
ArrayType
“
的
列
"instances”,其模式如下: instances[
ArrayType
]: 0 [ StructType:
列
"instances“转换为类型为"
浏览 117
提问于2020-07-10
得票数 0
1
回答
如何将数据架构
的
字符串拆分为每个结构
、
、
我想将
dataframe
的
架构拆分为一个集合。我正在尝试这个方法,但是模式被打印成一个字符串。我是否可以将其拆分为每个StructType
的
集合,以便对其进行操作(比如只
从
输出中提取数组
列
)?output.toList 目前
的
输出是 identifyArrayColumns: (
dataFrame
: org.apache.
spark
.sql.
DataFrame
,
Ar
浏览 0
提问于2018-03-09
得票数 0
回答已采纳
2
回答
[
Scala
][
Spark
]:转换数据帧
中
的
列
,保留其他
列
,使用withColumn和map [错误:缺少参数类型]
、
、
、
、
, C++]| CA||Robert,,Williams| [CSharp,|CA ||Michael,Rose, |
Spark
|NJ | .toDF("Name&qu
浏览 11
提问于2021-10-11
得票数 2
7
回答
如何在
spark
的
数据
中
“负选择”
列
、
、
、
这个df有"A“、"B”和"C“
列
。现在假设我有一个Array,它包含这个df
列
的
名称:我想以这样
的
方式来做一个df.select(),这样我就可以指定哪些
列
不能选择。例如:假设我不想选择
列
"B“。我试过了但这不起作用,因
浏览 21
提问于2015-07-15
得票数 22
回答已采纳
1
回答
函数
中
的
“应用程序不接受参数”错误消息
、
你好col("groupingCriteria"
浏览 3
提问于2017-12-13
得票数 0
2
回答
MongoTypeConversionException:即使显式架构不包含NullTypes,也无法使用Mongo
Spark
Connector将字符串强制转换为NullType
、
、
、
我正在将一个集合
从
MongodB导入到
Spark
。("collection", collectionName).load() 对于结果
DataFrame
中
的
data
列
,我得到以下类型: StructType(StructField(configurationName因此,在某些
列
中
至少有一些类型是NullType。(partitionDF.rdd, denullifyStruct(partitionDF.schema)) 发出fix
浏览 161
提问于2021-08-12
得票数 1
1
回答
Spark
HiveContext获取与配置单元客户端选择相同
的
格式
、
当配置单元表有像映射或数组这样
的
值时,如果你在配置单元客户端选择它,它们会显示为JSON,例如:{"a":1,"b":1}或[1,2,2]。在
Spark
中选择这些对象时,它们是
DataFrame
中
的
贴图/数组对象。当我使用
Spark
的
HiveContext时,我想使用与Hive客户端相同
的
格式。 我该怎么做呢?
浏览 1
提问于2018-07-20
得票数 0
1
回答
如何创建countVectorizer模型
的
一个
列
中
包含值数组
的
火花数据
、
、
中
创建第4
列
,其中包含所有这3
列
的
值数组,如| indiana|需要这个数组,因为countVectorizer模型
的
输入应该是包含值数组
的
列
。它不应该像下面的错误消息中提到
的
那样是字符串数据类型: 线程"main“java.lang.Illegal
浏览 1
提问于2017-09-05
得票数 0
回答已采纳
1
回答
向现有
DataFrame
添加mapType
列
、
、
关于
Spark
中
的
Scala
中
的
DataFrames,我有一个简单而快速
的
问题。我有一个现有的
Spark
DataFrame
(在
Scala
2.10.5和
Spark
1.6.3上运行),我想用
ArrayType
或MapType添加一个新
列
,但不知道如何实现。但不知道该怎么处理。我不想用“单一”值创建多个
列
,而是将它们存储在一个
列
浏览 9
提问于2019-11-20
得票数 0
1
回答
Spark
DataFrame
嵌套结构是否仅供选择?
、
我有一个包含一些数据
的
json文件,我可以从中创建
DataFrame
,我感兴趣
的
特定部分
的
模式如下所示:通过查看LogicalPlan
的
resolveGetField方法,我发现可以
从
StructType或
从
ArrayType
(StructType)中进行选择,但是有没有办法选择更深层次
浏览 1
提问于2015-05-28
得票数 23
回答已采纳
2
回答
如何在
Spark
(2.4) SQL -
Scala
2.11
中
避免
ArrayType
的
自动转换
、
、
、
给定
Spark
2.4和
scala
2.11
中
的
代码 val df =
spark
.sql("""select array(45, "something", 45)""") 如果我使用df.printSchema()打印模式,我会看到
spark
自动转换为字符串CAST(45 AS STRING)。array (nullable = false) | |-- element: string (conta
浏览 30
提问于2020-01-21
得票数 3
1
回答
创建不可
空
的
空
数组
列
、
我在
scala
中使用
spark
(2.4)。我有一个
dataframe
,我正在尝试用dé故障值(
空
数组)替换
空
值(我
的
数组
列
)。String],
浏览 7
提问于2022-08-02
得票数 0
2
回答
将星火
DataFrame
写入CSV
、
我正在尝试将
Spark
数据have写到CSV,但是由于数据文件
的
某些列有一个数组,如下所示:+--+-------------+---+--
的
列上迭代,对于那些类型为数组
的
列
,我想将它们压缩为mkString(", ")。我找到了下面的链接,它在Python
中
执行类似的操作:df.dtypes.map(dty
浏览 2
提问于2018-02-08
得票数 0
回答已采纳
4
回答
Spark
scala
删除
仅包含
空
值
的
列
、
、
有没有一种方法可以
删除
spark
dataFrame
中
只包含
空
值
的
列
?(我使用
的
是
scala
和
Spark
1.6.2)var validCols: List[String] = List() .count if (count >= 2){
浏览 6
提问于2016-09-11
得票数 7
3
回答
将JavaRDD转换为
DataFrame
时
的
火花错误: java.util.Arrays$ArrayList不是array<string>模式
的
有效外部类型
、
我正在使用
Spark
2.1.0。对于下面的代码,它读取文本文件并将内容转换为
DataFrame
,然后输入到Word2Vector模型
中
: ); new StructField("text", new
ArrayType
如果不支持Arrays$Arra
浏览 3
提问于2017-04-23
得票数 3
1
回答
使用
spark
流解析Event Hub复杂数组类型消息
、
、
、
、
我需要在body
中
解析Array Type,同时
从
eventhub读取数据。我们嵌套了json消息,但无法解析相同
的
消息: {"Name":"Rohit","Salary":"29292","EmpID":12,"Projects":{"ProjectID":"9191","ProjectName, StringType) .add("Salary"
浏览 19
提问于2021-04-06
得票数 1
回答已采纳
2
回答
在StringType中将
ArrayType
转换为PySpark
、
、
、
、
我正试图在我
的
数据集上运行PySpark
中
的
PySpark算法。got StringType.我
的
Dataframe
df
的
形式如下:+---+---------+--------------------+ only showin
浏览 0
提问于2018-04-05
得票数 2
回答已采纳
3
回答
检查
arraytype
列
是否包含
空
、
、
、
、
我有一个列为
arraytype
的
dataframe
,它可以包含整数值。如果没有值,它将只包含一个值,并且它将是
空
值。重要
的
:注意,
列
将不是null,而是具有单个值
的
数组;nulld
浏览 2
提问于2017-06-01
得票数 7
回答已采纳
1
回答
用考拉将dict
列表
转换为
DataFrame
、
、
、
、
我尝试将一组数据转换为Databricks
的
考拉
DataFrame
,但我一直收到错误消息:[{'A': None,
浏览 4
提问于2021-09-29
得票数 0
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
实时音视频
活动推荐
运营活动
广告
关闭
领券