如何从Scala的迭代列表中创建DataFrame？_Scala Spark -如何迭代Dataframe中的字段_尝试迭代从excel创建的DataFrame - 腾讯云开发者社区

scala、apache-spark、apache-spark-sql、spark-dataframe

我有以下Scala值： val values: List[Iterable[Any]] = Traces().evaluate(features).toList 我想把它转换成DataFrame。Product](data: Seq[A])(implicit evidence$2: reflect.runtime.universe.TypeTag[A])org.apache.spark.sql.DataFrameorg.apache.spark.rdd.RDD[A])(implicit evidence$1: reflect.runtime

浏览 159提问于2016-06-28得票数 38

回答已采纳

5回答

通过迭代Scala列名列表中的列，从中删除多个列

scala、apache-spark、apache-spark-sql

我有一个dataframe，它的列在400左右，我想根据我的要求删除100列。因此，我创建了一个Scala列表，其中包含100个列名。然后，我想迭代一个for循环，在每个for循环迭代中实际删除列。Col100”) for (i <- 0 to dropList.length -

浏览 7提问于2016-09-30得票数 11

回答已采纳

1回答

星星之火:如何在每个执行器中创建本地数据

scala、pandas、apache-spark、pyspark

在scala中，有一种方法可以在执行程序中创建本地数据，比如在中的熊猫。在map分区方法中，我希望将迭代器转换为本地dataframe (就像python中的大熊猫dataframe )，这样就可以使用dataframe特性而不是在迭代器上手工编写它们。

浏览 2提问于2018-02-09得票数 2

回答已采纳

1回答

使用列表中的每个元组值为列子集创建新的熊猫数据框架

python、pandas、list、for-loop、tuples

我有一个名为combo=('A'，'B')，('A'，‘B，'C')的列表，现在我想创建一个新的数据帧，从列表中的每个元组值子设置列名。df是原始数据框架，data_abr每次都会从列表中的元组中创建带有列名的新数据框架。‘，'B’，&#x

浏览 6提问于2022-06-05得票数 -1

2回答

在迭代元组方面，Scala中的sortWith是如何工作的？

scala、scala-3

列表可以按如下方式迭代：val thrill: List[String] = List(Will, fill, until)val res14: List[String] = List(Willy, filly, untily) 上面的代码首先

浏览 0提问于2021-05-07得票数 1

2回答

Scala:在DataFrame循环中将spark for中的值添加到可变列表

scala、apache-spark、apache-spark-sql

我想用来自数据帧的值更新在for循环外部声明的MutableList的元素。我将列表初始化为空，并期望列表在循环结束时添加n个元素。然而，似乎只有一个元素返回到空列表中(永远不会使用新添加的内容进行更新)，并且当循环结束时，列表又回到了空状态。只有当我在一个dataFrame上迭代时才会发生这种情况，如果我在一个固定的范围内迭代，比如1-10，返回的</e

浏览 100提问于2019-09-26得票数 0

回答已采纳

2回答

将Pyspark的Dataframe转换为scala数据帧

python、azure、scala、dataframe、databricks

在Databricks下，我使用此命令从Python Dataframe创建dataframe %python wordsDF = sqlContext.createDataFrame(pandasDF我想将数据发送回Azure Datalake Gen2，并且我想使用Scala dataframe。如何从Pyspark返回/转换Dataframe到scala Dataframe？

浏览 36提问于2021-10-05得票数 0

1回答

如何从Scala自定义对象列表创建数据帧

scala、apache-spark、dataframe、apache-spark-sql

我们可以使用以下命令从Java对象列表创建一个dataframe：对于Java，Spark可以直接从类推断模式，在本例中是Example.class。有没有办法在Scala中做同样的事情？

浏览 0提问于2018-04-11得票数 0

2回答

groupby中的scala* spark reduce列表*

list、scala、apache-spark、reduce

我有两列的spark DataFrame colA colB1 22 5 res += i * (3+res) 返回值为res 所以我得到了： colA colB2 78 我如何在scala中做到这一点

浏览 13提问于2021-10-14得票数 0

3回答

isin抛出火花中列函数中的堆栈溢出错误

scala、apache-spark、apache-spark-sql

我正在我的scala应用程序中使用spark 2.3。我有一个dataframe，它是在我共享的示例代码中创建的，名为sqlDF。我有一个字符串列表，其中包含下面的项目 2 |-5 |1 0

浏览 0提问于2019-07-16得票数 2

回答已采纳

1回答

Java -有没有一种不用迭代就能查询Apache Spark模式的方法？

java、apache-spark、struct、schema

我正在尝试找出是否有一种方法可以直接从从行的数据集派生的Spark模式中查询结构。有没有某种与Scala提供的dataframe.schema("nameOfStruct")等价的Java？我尝试过找到这样一个预构建的函数，但我唯一能找到的就是遍历Structs列表或创建迭代器的方法。当Scala</

浏览 10提问于2019-06-17得票数 2

回答已采纳

2回答

迭代更改列类型--火花数据帧

apache-spark、dataframe、apache-spark-sql

我在Scala中有一个列名列表，如下所示另外，我有一个包含这些列的数据框架，但都是字符串。现在，我想通过迭代dataframe的列表或列来转换dataframe的列，因为我的列列表非常大，而且我不能使用这么多的</em

浏览 5提问于2016-01-28得票数 3

回答已采纳

1回答

spark scala从dataframe中的列表创建映射

scala、apache-spark

我的模式如下： |-- id: string (nullable = true) | |--

浏览 0提问于2017-09-07得票数 0

2回答

在Python3中创建摄氏到华氏转换器的范围有困难

python-3.x

我的指示是一旦代码正常工作，它应该显示两列，一列是摄氏，另一

浏览 1提问于2019-01-19得票数 1

2回答

Regex与dataframe列值匹配

scala、apache-spark

我想使用dataframe列在Map[String,List[scala.util.matching.Regex]]之间执行查找。如果任何一个List[scala.util.matching.Regex]与dataframe列值匹配，那么它应该从Map[String,List[scala.util.matching.Regex]]Map[String,List[scala.util.matching.Regex]] = Map(m1 -> List(rule1,

浏览 4提问于2020-02-06得票数 0

回答已采纳

2回答

在spark中循环加载文件

scala、apache-spark、apache-spark-sql

我在一个具有相同.txt扩展名的目录中有n个文件，我想在一个循环中加载它们，然后为每个文件创建单独的dataframes。我读过，但在我的例子中，我的所有文件都有相同的扩展名，我想一个接一个地迭代它们，并为每个文件生成dataframe。我从计算目录中的文件开始，代码如下 sc.wholeTextFiles("/path/to/dir

浏览 3提问于2018-08-07得票数 0

回答已采纳

2回答

Scala DataFrame中的迭代

scala、apache-spark

我有一个DataFrame在星火样帐户，其中有5个不同的列。val sampledf= sqlContext.sql(select * from Sampledf)我意识到在甲骨文中，我们不能提供条件下的.中的1000多个值。由于OracleTable中的大量数据从OracleTable (acctnum in (1,2,3，...100

浏览 0提问于2018-08-06得票数 0

回答已采纳

2回答

在没有O(n)迭代的情况下，将Java列表转换为Scala？

list、scala、scala-collections

的答案很好地解释了如何使用Scala的Java转换器将Java列表更改为Scala列表。不幸的是，我需要将列表列表从Java转换为Scala类型，而该解决方案不起作用：java.util.List[java.util.List[String]].asScala-> scala.collection.immut

浏览 6提问于2014-07-31得票数 1

回答已采纳

1回答

Python -函数，该函数具有存储来自其他函数的结果的数据。

python、pandas

为此，我有以下代码： df = pd.DataFrame([]) {'id': id,1,Draft23,Draft45,Draft6 1,Draf

浏览 3提问于2020-04-11得票数 0

回答已采纳

1回答

哪些星火转换会导致数据仓库上的混乱？

apache-spark、apache-spark-sql

我在几个地方读到，如果可能的话，应该避免包含洗牌阶段的转换，因为洗牌涉及到在节点之间通过网络发送数据，这会给程序带来很高的性能成本。我在寻找一个星火转换列表，这些转换可能会导致对Spark的2.4+数据格式进行洗牌，而我想出的只是这个关于旧的RDD的。

浏览 1提问于2019-12-16得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云