使用Scala和Spark在列中字符串的数组[Array[String]]_Scala Spark如何将列array[string]转换为包含JSON数组的字符串？_如何在Scala/Spark中将带有字符串的列转换为Array[String]？ - 腾讯云开发者社区

scala、apache-spark、apache-spark-sql、user-defined-functions

我在Spark DataFrame中有两列，每一列中的每个条目都是字符串数组。")def concat_array(firstarray: Array[String], seco

浏览 1提问于2018-03-07得票数 9

回答已采纳

1回答

Spark HiveContext获取与配置单元客户端选择相同的格式

apache-spark、hive

当配置单元表有像映射或数组这样的值时，如果你在配置单元客户端选择它，它们会显示为JSON，例如：{"a":1,"b":1}或[1,2,2]。在Spark中选择这些对象时，它们是DataFrame中的贴图/数组对象。如果对每一行进行字符串化，则它们是Map("a" -> 1, "b" -> 1)或WrappedArray(1, 2, 2

浏览 1提问于2018-07-20得票数 0

2回答

使用Scala和Spark在列中字符串的数组[Array[String]]

arrays、scala、dataframe、apache-spark

这是我的数据帧： +--------------------+ | NewsId| newsArr||[[n/a], [DH, AH0]...| 我想将"transArr“列单元格变成如下所示的字符串： +--------------------+|n/a DH AH0... | 有没有相对简单的解决方案？

浏览 39提问于2020-10-20得票数 0

回答已采纳

1回答

在Scala中，如何在保持数据类型的同时从dataframe获取列？

scala

我有以下数据：root |-- words: array (nullable= true) |-- lemma: array (nullable = true) |

浏览 1提问于2017-02-15得票数 0

1回答

spark scala :将Struct列的数组转换为字符串列

arrays、json、scala、apache-spark

我有一个列，它的类型是从json文件推导出的array < Struct >。我希望将数组< Struct >转换为字符串，这样我就可以在配置单元中保持该数组列的原样，并将其作为单个列导出到RDBMS。scala> val temp = spark.read.json("s3://check/1

浏览 0提问于2017-06-02得票数 4

回答已采纳

1回答

随着数据集和列数的增加，Spark作业的执行时间呈指数级增长

scala、apache-spark、bigdata

我已经在spark中创建了一个固定宽度的文件导入解析器，并在各种数据集上执行了一些执行测试。它可以很好地工作到1000列，但随着列数和固定宽度长度的增加，Spark作业性能会迅速下降。对于20k列和固定宽度长度超过10万的列，执行时间很长。我发现的类似问题之一：

浏览 1提问于2018-09-15得票数 1

1回答

如何将arrays[String]列转换为字符串列

arrays、scala、apache-spark、apache-spark-sql

在scala+spark中，我有一个包含两列Array[String]的数据 |-- v2: array (nullable = true)我想根据

浏览 0提问于2019-08-10得票数 1

回答已采纳

1回答

Array[String]的Scala级联列为单个Array[String]

scala、apache-spark、dataframe、data-science

我有一个带有id - (Int)和tokens - (array<string>)列的Spark (Scala)：0,["a","b","c"]...假设我能够通过SparkSession检索数据并转换为case类： case class Token(id: Int, tokens: Array

浏览 0提问于2018-12-12得票数 0

回答已采纳

2回答

如何将双倍数组转换为RDD[String]

scala、apache-spark、rdd

我需要将Array[Array[Double]]转换为RDD，例如将[[1.1, 1.2 ...], [2.1, 2.2 ...], [3.1, 3.2 ...], ...]转换为val testData = spark.sparkContexttestDensities .

浏览 6提问于2017-03-24得票数 3

回答已采纳

2回答

如何在Spark (2.4) SQL -Scala2.11中避免ArrayType的自动转换

scala、apache-spark、casting、apache-spark-sql

给定Spark 2.4和scala 2.11中的代码 val df = spark.sql("""select array(45, "something", 45)""") 如果我使用df.printSchema()打印模式，我会看到spark自动转换为字符串CAST(45 AS STRING)。root |-- <e

浏览 30提问于2020-01-21得票数 3

1回答

使用字节数组创建火花DataSet时出错

scala、apache-spark、apache-spark-sql

我正在使用case类和spark.sql({query}).as[MyCaseClass]语法在scala中创建Spark ip: Array[Array[Byte]] val hbaseDataSet = spark

浏览 1提问于2018-11-26得票数 1

回答已采纳

2回答

如何将函数应用于Spark DataFrame的列？

scala、apache-spark、dataframe、apache-spark-sql

让我们假设我们有一个Spark DataFrameClass[_ <: org.apache.spark.sql.DataFrame] = class org.apache.spark.sql.DataFrame使用下面的模式root|-- tk: array (nullable = true) ||-- element: string</em

浏览 2提问于2016-01-05得票数 7

回答已采纳

2回答

为什么$不能处理String类型的值(并且只直接处理字符串文本)？

scala、apache-spark、apache-spark-sql

" val Date = "Date"} 然后，我想按列对我如何将$和ColumnNames.JobSeekerID结合在一起来完成这一任务？

浏览 2提问于2018-01-11得票数 2

回答已采纳

1回答

Spark Scala UDF中的异常处理

scala、apache-spark、exception、apache-spark-sql、user-defined-functions

def parse_values(value: String) = { values.foldLeft(Array[(Int, Double)]()) { val Array(k, v) = present.split(",")(0).split(":") acc :

浏览 22提问于2020-07-24得票数 0

1回答

如何使用Scala解压缩星火DataFrame中的列

scala、apache-spark、gzip

我有一个包含压缩内容的列的拼花文件。目前，我的Spark (用Scala编写)作业使用Java.io Reader链来压缩内容：val byteArrayInputStreambufferedReader: BufferedReader = new BufferedReader(inputStreamReader) var line: <

浏览 0提问于2019-04-16得票数 1

2回答

错误:值显示不是字符串的成员。

scala、apache-spark、apache-spark-sql

要查看标头变量的内容，我必须做什么？

浏览 0提问于2017-08-19得票数 0

回答已采纳

3回答

Spark:将字符串列转换为数组

scala、apache-spark、pyspark

如何将作为字符串读取的列转换为数组列？即从下面的模式转换root |-- b: string (nullable = true和python实现。另外，我如何在读取文件本身的同时处理它呢？我有大约450列的数据，其中有几列我想以这种格式指定。目前我正在阅读pyspark，如下所示：

浏览 1提问于2017-06-22得票数 20

回答已采纳

1回答

spark dataframe根据条件从多列中选择值

apache-spark、apache-spark-sql

数据模式，|-- id: string (nullable = true)|-- col2: string (nullable= true) |1 |["x","y","z"]|[123,"null","null"]| 从上面的数据中，我想过滤出x在</

浏览 3提问于2019-11-25得票数 0

3回答

仅在字段存在的情况下选择字段(SQL或Scala)

sql、scala、apache-spark、dataframe、apache-spark-sql

输入数据可能并不总是所有的列。在SQL或SCALA中，我希望创建一个select语句，即使dataframe没有列，它也不会出错，它只会输出存在的列。|51 |42 |2 ||89 |44 |9 | 如果dataframe如下所示，我希望相同的语句工作，只需忽略不存在的内容，只需输出现有的列</

浏览 0提问于2019-03-18得票数 2

回答已采纳

1回答

为什么使用组合会产生"java.io.NotSerializableException: java.io.NotSerializableException“

scala、apache-spark

问题： at org.apache.spark.serializer.JavaSerializationStream.writeObject(JavaSerializer.scala:46)].split("\\;;").map(_.trim))Array[

浏览 1提问于2017-05-06得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

将Array[string]类型的两列合并为新的Array[string]列

Spark HiveContext获取与配置单元客户端选择相同的格式

使用Scala和Spark在列中字符串的数组[Array[String]]

在Scala中，如何在保持数据类型的同时从dataframe获取列？

spark scala :将Struct列的数组转换为字符串列

随着数据集和列数的增加，Spark作业的执行时间呈指数级增长

如何将arrays[String]列转换为字符串列

Array[String]的Scala级联列为单个Array[String]

如何将双倍数组转换为RDD[String]

如何在Spark (2.4) SQL -Scala2.11中避免ArrayType的自动转换

使用字节数组创建火花DataSet时出错

如何将函数应用于Spark DataFrame的列？

为什么$不能处理String类型的值(并且只直接处理字符串文本)？

Spark Scala UDF中的异常处理

如何使用Scala解压缩星火DataFrame中的列

错误:值显示不是字符串的成员。

Spark:将字符串列转换为数组

spark dataframe根据条件从多列中选择值

仅在字段存在的情况下选择字段(SQL或Scala)

为什么使用组合会产生"java.io.NotSerializableException: java.io.NotSerializableException“

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐