在Spark-Scala中，如何将数组列表复制到DataFrame中？

在Spark-Scala中，可以通过以下步骤将数组列表复制到DataFrame中：

import org.apache.spark.sql.{SparkSession, Row}
import org.apache.spark.sql.types.{StructType, StructField, StringType}

val spark = SparkSession.builder().appName("Array to DataFrame").getOrCreate()

val arrayData = Seq(
  Row("John", "Doe"),
  Row("Jane", "Smith"),
  Row("Bob", "Johnson")
)

val schema = new StructType().add(StructField("FirstName", StringType, true)).add(StructField("LastName", StringType, true))

val df = spark.createDataFrame(spark.sparkContext.parallelize(arrayData), schema)

现在，你可以使用df变量来操作和处理这个DataFrame了。

注意：这里的示例代码仅展示了将数组列表复制到DataFrame的基本步骤，实际应用中可能需要根据具体需求进行适当的修改和调整。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云