Spark Scala计数函数没有响应_如何使用spark scala获取年份计数_Scala和Spark UDF函数 - 腾讯云开发者社区

oracle、scala、apache-spark

我正在从oracle db加载一些数据，并且尝试在data.But上执行计数操作，但没有得到任何结果，最终导致会话超时。如果我执行任何其他函数，比如first()，show()，我会得到结果。我尝试使用不同的选项启动scala shell，如下所示。spark2-shell --jars /oracle/12c/product/12.1.0/client/jdbc/lib/ojdbc6.jar --executor-memory 10G --

浏览 15提问于2019-05-07得票数 0

6回答

如何计算星火数据表中的列数？

scala、apache-spark、dataframe、apache-spark-sql

我知道如何计数列中的行数，但我希望计数列数。val df1 = Seq( ("spark", "scala", "2015-10-15", 11,"abhishek"), ("spark

浏览 0提问于2018-07-27得票数 17

回答已采纳

1回答

Spark RDD将内部对象映射到行

scala、apache-spark

21658392713 ,21626890421 1 ,21623461747 ,21626890421 scala> val sGrouped = grouped(Array[String], String))])] = ShuffledRDD[85] at groupBy at <console&g

浏览 0提问于2015-12-18得票数 1

1回答

线程"main“java.lang.NoSuchMethodError中的异常: scala.Predef$.$scope()Lscala/xml/TopScope$；

scala、apache-spark

我正在运行一个单词计数程序，但我得到了下面的错误，我添加了scala-xml_2.11-1.0.2.jar at org.apache.spark.ui.jobs.StagesTab.<init>(StagesTab.scala:34) at org.apac

浏览 3提问于2016-12-16得票数 4

1回答

火花3.0-火花聚合函数给出了与预期不同的表达式

apache-spark、apache-spark-sql

Spark session available as 'spark'.scala> import org.apache.spark.sql.functions._count(x) scala> println(sumDistinct("x"

浏览 2提问于2020-09-23得票数 2

回答已采纳

4回答

无法在Spark (Scala)中的数据帧上执行用户定义函数

scala、apache-spark、user-defined-functions

我想在这里完成的是读取列路径中的文件，对文件中的记录进行计数，并将行计数的结果写入到数据帧的新列中。我尝试了以下函数和udf： def executeRowCount(fileCount: String): Long = { at org.apache.spark.rdd.MapPartitionsRDD.compute(MapPartitionsRDD

浏览 30提问于2019-04-01得票数 2

回答已采纳

1回答

如何从流SQL运行WordCount示例(抛出NoSuchMethodError)？

java、scala、apache-spark

我正在尝试运行流式SQL()示例字计数。这反过来又使用催化剂项目。我可以运行sbt软件包，没有任何问题。然而，当我确实提交scala代码时，我会遇到以下问题。at org.apache.spark.sql.streaming.WindowedPhysicalPlan.children(windowedPlans.scala:39) at org.apache.spark.sql.streaming.WindowedPhysicalPlan.children(windowedPlans.sc

浏览 4提问于2015-09-08得票数 2

回答已采纳

2回答

对spark数据帧中的列进行分组并对其他列进行计数

apache-spark

尝试处理spark数据帧。

浏览 24提问于2020-07-06得票数 0

回答已采纳

1回答

如何在spark中对scala中的Long和BigInt进行数学运算

scala、apache-spark、apache-spark-sql、bigdata

我有两个不同类型的值，如下所示ageSum: org.apache.spark.sql.DataFrame = [sum(age): bigint]scala> totalEntries第一个值来自数据帧上的聚合函数，第二个值来自数据帧上的总计数

浏览 7提问于2017-01-26得票数 0

回答已采纳

2回答

错误SparkContext:初始化SparkContext时出错。java.lang.IllegalArgumentException:系统内存259522560必须至少为471859200

java、apache-spark、intellij-idea

每当我试图运行一个简单的单词计数示例时，我都会得到以下错误： 18/10/22 01:43:14错误SparkContext: SparkContext初始化错误。(UnifiedMemoryManager.scala:216) at org.apache.spark.memory.UnifiedMemoryManager$.apply(UnifiedMemoryManager.scala:198) at org.apache.spark.SparkEnv$.create(Spark

浏览 0提问于2018-10-21得票数 4

1回答

星星之火: java.lang.NoClassDefFoundError: scala/collection/mutable/ArraySeq$ofRef

scala、apache-spark

我试图使用spark-submit运行一个简单的单词计数程序，并得到一个异常。线程"main“中的异常java.lang.BootstrapMethodError: java.lang.NoClassDefFoundError: scala/collection/mutable/ArraySeq$ofRef at SparkWordCount$.main(SparkWordCount.scala:18) val count = input.flatMap(l

浏览 3提问于2019-09-27得票数 1

回答已采纳

2回答

RDD[Array[String]]与RDD[String]的计数速度

scala、apache-spark、rdd

我正在尝试使用count()方法来计数以下RDD元素。第一项建议如下：data_wo_header: org.apache.spark.rdd.RDD[String]当我真的指望这个的时候，我会得到：res1: Long = 20000263 这个操作比较快，大约需要26秒。: org.apache.spark.rdd.RDD[Array[St

浏览 1提问于2017-03-12得票数 0

回答已采纳

1回答

群集wso2应用编程接口管理器网关不向wso2发布统计信息

wso2-am、wso2-das

我正在设置mysql manager 1.10.x和DAS3.0.1，以便使用wso2发布API统计数据。我的API管理器系统与单独的VM上的网关工作节点群集在一起。但是当我从网关工作者日志向发布的API发出请求时，我看不到它向DAS接收器发布任何统计数据。DAS汇总表中也没有数据。如何使API管理器网关工节点将统计数据发布到DAS？我在配置中遗漏了什么吗？(BroadcastManager.scala:62) at org.apache.spark.SparkContext.broadc

浏览 2提问于2017-06-01得票数 1

1回答

迭代一个庞大的列表会导致gc开销限制超过

scala、apache-spark、garbage-collection

我在scala中所做的显然是错误的，但我不知道如何修复它。这是错误输出： at scala</e

浏览 1提问于2017-07-09得票数 1

回答已采纳

1回答

Spark-Scala在文本文件中写入输出

scala、apache-spark

我正在执行spark中的wordcount程序，并试图将结果存储在一个文本文件中。Loading /opt/spark-2.0.2-bin-hadoop2.7/bi

浏览 0提问于2017-10-10得票数 0

2回答

减少潜在的空RDD

scala、apache-spark

我觉得做一个计数()来测试是否空虚是非常昂贵的，我想知道是否有一个更好的方法来处理这种情况。$1$$anonfun$apply$36.apply(RDD.scala:1005) at org.apache.spark.rdd.RDD$$anonfun$reduce$1.apply(RDD.scala:1005) at org.apache.spark.rdd.

浏览 8提问于2015-12-10得票数 8

回答已采纳

1回答

在普通的Scala中有等效的爆炸函数吗？

scala

我试图寻找爆炸功能或它的等价物在普通的scala，而不是火花。使用Spark中的below函数，我能够将一个具有多个元素的行平平成多个行，如下所示。scala> import org.apache.spark.sql.functions.explode scala> val test = spark.read.json(spark

浏览 2提问于2020-02-24得票数 1

回答已采纳

1回答

RDD映射函数以不同的方式工作

scala、apache-spark、rdd

我有下面的代码，一般来说，map函数是一个高阶函数，它在参数中接受一个函数，并使用函数计算元素。但在本例中，map不是一个函数，而是一个Map类型。不能理解map函数是如何工作的？scala> val pws = Map("Apache Spark" -> "http://spark.apache.org/", "Scala&

浏览 2提问于2016-09-23得票数 0

1回答

Scala异常

scala、apache-spark、sbt

我正在学习Scala编程，使用Windows7和最新的Spark2.2.0版本在Apache .I am中编写单词计数驱动程序。在执行程序时遇到下面提到的错误。如何修正和取得结果？(SparkConf.scala:723) at org.apache.spark.SparkConf$.(SparkConf.scala:571) at org.apache.spark.SparkConf$.(SparkConf.scala)在org.apache.<e

浏览 1提问于2017-09-24得票数 0

回答已采纳

1回答

对数据帧执行操作时出现Spark* sqlContext异常*

java、apache-spark、apache-spark-sql

当我对拼图文件进行计数时，我得到了下面的错误， java.lang.NoSuchMethodError: org.apache.parquet.schema.Types$MessageTypeBuilder.addFields<init>(SqlNewHadoopRDD.scala:169) at org.ap

浏览 19提问于2021-08-06得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云