在Scala spark中有没有办法将这个数据帧转换成这样？_Spark在Scala中有条件地合并2个数据帧 - 腾讯云开发者社区

、、、

数据帧的转换 Col A || date1 || Value1 || Value2 || Date2 11 ||2002-08-14 || 44.234 || 485.5975 |

浏览 10提问于2020-01-23得票数 0

回答已采纳

1回答

将Scala中的WrappedArrays列转换为Vector[Double]列

、、

我在Scala中有一个包含3个观察值的数据帧。其中一列包含包装的数组，这样当我写到：我会回来的有没有一个函数可以把包

浏览 0提问于2017-02-27得票数 0

1回答

数据帧的scala joinWithCassandraTable结果

、、

我正在使用Datastax spark- Cassandra -connector来访问Cassandra中的一些数据。我的需求是将RDD与Cassandra表连接起来，获取结果并将其存储在hive表中。我正在使用joinWithCassandraTable加入cassadra表。] = CassandraJoinRDD[17] at RDD at CassandraRDD.scala:19 我尝试了以下步骤来转换为数据帧，但所有方法都不起作用。type s

浏览 20提问于2020-07-17得票数 0

1回答

使用spark进行XML解析

我在hive中有一个表，其中有两列id(int)和xml_column(string)。xml_column实际上是一个xml_column，但它被存储为字符串。xml version="1....|我的问题是:我想解析这个xml，并使用spark (scala)分解成模式格式。有人能帮我解决这个问题吗？尝试使用数据块spark xml库，但此库处理xml文件。

浏览 6提问于2018-05-31得票数 0

2回答

AWS胶与雅典娜

、、、

我们正处于将所有用scala编写的星火作业迁移到aws胶水的阶段。当前流： Apache Hive -> Spark(处理/转换) -> Apache Hive -> BI昨天我完成了这个任务，我正在做研发工作。我的问题是：我们可以在apache胶水中运行相同的代码，因为它具有动态框

浏览 5提问于2020-03-16得票数 0

回答已采纳

3回答

如何将注册为spark表的表放入数据帧

、、、

我已经使用spark-thriftserver connection将表从PostgreSQL数据库导入到spark-sql中，现在我可以从直线上看到这些表。有没有办法把这些表格转换成spark数据帧？

浏览 1提问于2016-09-25得票数 2

1回答

与Scala相比，使用groupBy的Pyspark聚合非常慢。

、、、

版本：import org.apache.spark.SparkConf def版本在26秒内完成，而Python版本大约需要6分钟。at Spark.scala:17) finished in 9.619 s 17/01/25 16:26:23 INFO DAGScheduler: Job 0 finished: collectat Spark

浏览 5提问于2017-01-25得票数 0

2回答

在熊猫(python)中，能不能将星星之火(scala)转换成数据(Python)

、、、

Dataframe是使用scala创建的。val someDF = spark.createDataFrame( spark.sparkContext.parallelize(someData), StructType(someSchema) )PySpark提供了.toPandas()来将火花数据转换成熊猫，但是scala(我可以找到)并没有对应的数据。

浏览 1提问于2020-04-05得票数 0

回答已采纳

1回答

如何处理spark* scala中withcolumn和continue剩余记录异常*

、、

我正在尝试使用scala中的withColumn向spark数据帧中添加一列，我正在尝试用try-catch编写这段代码，这样我就可以捕获异常并记录这些错误记录在spark-scala中有没有一种方法来处理withColumn中发生的异常？请提个建议。

浏览 2提问于2020-03-04得票数 0

1回答

我们如何使用在星星之火条件下的蜂巢查询？

、、

我刚开始使用scala框架，下面是有子查询的查询。根据我有限的知识火花不支持子查询，而且一次支持多个列？select id, email from test1 group by id ,email ; 在spark上面的查询转换成这样，但是问题是我们如何使用来自不同数据帧的哪个条件。我们如何将整个查询转换为spark？

浏览 4提问于2021-03-08得票数 0

回答已采纳

1回答

将Sql查询转换为spark

、、

我有一个sql查询，我想把它转换成spark-scalaFROM (SELECT DISTINCT aid,DId,BM,BY,TO FROM SU WHEREcd =2) t SU是我的数据帧。我是这样做的 SELECT aid,DId,BM,BY FROM (SELEC

浏览 0提问于2017-01-25得票数 0

回答已采纳

3回答

pySpark将mapPartitions的结果转换为spark* DataFrame*

、、

我有一个作业需要在分区的spark数据帧上运行，该进程如下所示： rdd = sp_df.repartition(n_partitions, partition_key).rdd.mapPartitions现在我希望将结果转换成spark数据帧，我这样做的方式是： sp = None if i == 0:sp = spark</

浏览 124提问于2019-12-10得票数 4

回答已采纳

1回答

将spark数据帧转换为sparklyR表"tbl_spark“

、、

我正在尝试将spark dataframe org.apache.spark.sql.DataFrame转换为sparklyr表tbl_spark。在这里，df是spark数据帧。(package.scala:42)at org.

浏览 0提问于2018-01-17得票数 8

2回答

使用scala统计spark数据帧中列组合的实例

、、

我在scala中有一个名为df的spark数据帧，它有两列，即a和b，a列包含字母，b列包含数字，如下所示。df.select("a","b").distinct a b g 0 f 1a b count ----

浏览 2提问于2015-10-28得票数 9

回答已采纳

6回答

spark sql cast函数创建具有空值的列

、、

我在Spark中有以下数据框架和模式|3754978| spark| 1| scala> df print

浏览 118提问于2017-06-21得票数 1

1回答

如何在scala中实现avro到GenericRecord的数据帧转换

、

我陷入了将avro数据帧转换为GenericRecord/ByteArray的困境，在那里我在google上冲浪，他们为我提供了相反的解决方案。有人尝试过在scala中将AVRO RDD/Dataframe转换为GenericRecord或ByteArray吗？它会像这样返回

浏览 4提问于2017-10-16得票数 0

1回答

包含空格的列的saveAsTable失败

、、、、

我有一段pyspark代码，用于将数据帧转换为物理表：如果数据帧df包含名称中包含空格的列$.checkConversionRequirement(ParquetSchemaConverter.scala:581) at org.apache.spark.sql.execution.datasources.parq

浏览 4提问于2018-03-08得票数 1

1回答

将dataframe转换为dataset会保留额外的列

、、、

在Spark 2.11中，当将Dataframe转换为Dataset时，spark会保留甚至在dataset的类中都没有引用的额外列。scala> case class F(x: String, y: String)import spark.implicits._ scala> val df = S

浏览 32提问于2021-07-02得票数 1

1回答

spark vs pandas dataframe (具有大列) jupyter笔记本中的head(n)

、、、、

几天后，数据带来了大量的功能。为了获得简短的数据摘要，人们将数据加载到数据框中，并使用head()方法显示数据。使用Jupyter Notebook( Toree for scala)进行实验是很常见的。Spark (scala)很适合处理大量数据，但是它的head()方法不能在水平滚动的notebook中显示列标题。熊猫数据帧头 Spark Scala

浏览 3提问于2018-06-13得票数 2

2回答

如何并行化数据帧分区上的操作

、、

我有一个数据帧df =| id||113331567dc042f...|就像这样。df2 = df.repartition(10) df2.foreach-partition

浏览 2提问于2021-07-06得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云