在Spark中使用带map的函数时任务不可序列化(Scala)_Spark Scala中的任务不可序列化错误_在Scala Spark中使用与DataFrame相关的过滤函数中的定义值 - 腾讯云开发者社区

、、、、

我注意到在DataFrame上使用了一个窗口函数之后，如果我用一个函数调用map()，那么Spark会返回一个“任务不可序列化”的异常--这是我的代码： val hc:org.apache.spark.sql.hive.HiveContext) at org.apache.spark.util.ClosureCleaner$.org$apache$spar

浏览 6提问于2016-05-18得票数 15

回答已采纳

10回答

不可序列化的任务:仅对类而不是对象调用外部闭包函数时的java.io.NotSerializableException

、、

在调用闭包之外的函数时，会产生奇怪的行为：问题是，我需要类中的代码，而不是对象。知道为什么会这样吗？<em

浏览 10提问于2014-03-23得票数 251

回答已采纳

1回答

星星之火:不使用聚合的序列化

、、

我有这个类(在Java中)，我想在星火(1.6)中使用它： private Map<String, Integer> counts; conf.set("spark.serializer", "org.apache.spark<

浏览 3提问于2016-07-06得票数 1

回答已采纳

1回答

org.apache.spark.SparkException:不可序列化的任务，wh

、、、、

当我实现自己的分区程序并试图对原始的rdd进行洗牌时，我遇到了一个问题。我知道这是因为引用了一些不是可序列化的函数，但是在添加对于每一个相关的类，这个问题仍然存在。线程"main“中的org.apache.spark.util.ClosureCleaner$.ensureSerializable(ClosureCleaner.scala</

浏览 4提问于2016-04-07得票数 0

1回答

在Spark中使用带map的函数时任务不可序列化(Scala)

、

还有另一个“任务不可序列化”的问题。抱歉，Scala和Spark的新手有点挣扎…… 所以我有一个带有方法的对象 object transformations { .map(x => AnotherCaseClass(x.col1, x.col2, x.col3

浏览 2提问于2019-03-11得票数 2

1回答

在星火中不可序列化的任务

、、

org.apache.spark.rdd.RDD.map(RDD.scala:286) at org.apache.spark.api.java.JavaRDDLike$class.map(JavaRDDLike.上不可序列化的任务在org.apache.spark.api.java.AbstractJavaRDDLike.map(JavaRDDLike.scala</em

浏览 3提问于2015-06-28得票数 3

回答已采纳

1回答

任务不可序列化异常

、

由于某些原因，我得到的是以下代码中不可序列化的任务异常。我是运行在火花本地使用sbt测试。(SparkContext.scala:1623) at test.scala.org<redacted>.NQTest$.testDatasets(NQTest.<e

浏览 1提问于2015-06-17得票数 0

1回答

Scala火花-任务不可串行化

、

我有以下代码，其中错误在sc.parallelize() .map { case ((k1, v1), (k2, v2线程"main“中的异常:在org.apache.spark.util.ClosureCleaner$.ensureSerializable(ClosureCleaner.scala:315) at org.apache.spark.util

浏览 10提问于2015-09-18得票数 2

回答已采纳

2回答

org.apache.spark.SparkException:不可序列化的任务-传递RDD

、

我上了三节课错误。完整的堆栈跟踪见下文。org.apache.spark.rdd上不可序列化的任务org.apache.spark.rdd.RDD$$anonfun$map$1.apply(RDD.scala:293) at org.apache.spark.rdd.RDDOperationScope$map$1.app

浏览 3提问于2015-11-06得票数 1

2回答

火花驱动程序如何序列化发送给执行器的任务？

RDD通过对象中用户定义的函数/方法进行一系列转换。这些函数以任务的形式传递给执行者。这些任务是火花核心中定义的Scala类的实例。我假设用户定义的函数/方法包装在一个任务对象中，并传递给执行者。在这里，序列化到底有

浏览 3提问于2015-07-12得票数 10

回答已采纳

1回答

ClassTag使Spark序列化对象

、、

(x)因为Foo是不可序列化的。为什么函数文本传递给map，导致Foo在引用隐式参数ClassTag时被序列化？我怎么才能绕过它？当Foo在Int上而不是T上工作时，这是可行的。我的实际代码正在尝试toArray，但这是同样的问题。$.improveException(SerializationDebugger.scala:

浏览 1提问于2015-08-07得票数 0

回答已采纳

1回答

scala映射函数中的"NotSerializableException“

、、

(parseLine)}使用spark的默认org.apache.spark.util.ClosureCleaner$.ensureSerializable中的异常:在org.apache.spark.util.ClosureCleaner$.clean(ClosureCleaner.scala:162) at org.apache.spark.Sp

浏览 3提问于2020-02-12得票数 1

回答已采纳

1回答

我有一个RDD格式的RDD((Long，Long)，(Long，Long))，我需要隐藏或转换为RDD((Long，Long)，(Long，Long))，其中第二个RDD元组基于来自第一个RDD的函数。我会得到以下错误：线程"main“中的异常:在org.apache.spark.util.ClosureCleaner$.ensureSerializable(ClosureCleaner.scala(SparkContext.sc

浏览 0提问于2017-03-02得票数 5

3回答

Scala:不可序列化错误的任务

、、

我正在使用IntelliJ社区版与Scala插件和火花库。我仍然在学习星火，并且正在使用Scala工作表。我编写了以下代码，删除字符串中的标点符号： val punctPattern = "[^a-zA-Z0.clean(/home/ubuntu/src/main/scala/Test.sc:104)，

浏览 1提问于2017-04-24得票数 7

回答已采纳

1回答

对象不可序列化的org.apache.spark.SparkContext。

、

我在星火中学习广播变量，所以我试着利用它。我使用的是火花壳(版本1.6.0)。(www.yahoo.com,Yahoo,10))sc.stop import org.apache

浏览 0提问于2016-08-11得票数 0

1回答

Spark streaming:任务"predict“不可序列化

、、、

我正在尝试使用模型来预测一个spark流程序，但我在这样做时遇到错误:任务不可序列化。:304) at org.apache.spar

浏览 0提问于2015-10-25得票数 0

1回答

火花与卡桑德拉并行处理

、

我还有一项任务要做。假设该数组如下所示：数组中最多可以有100.000个值。对于数组中的所有元素，我应该读取Cassandra的数据，执行一些计算并将数据插入Cassandra。context to make the querysave it back to Cassandra}) 我得到序列化异常，因为

浏览 4提问于2016-04-21得票数 0

2回答

Spark + Json4s序列化问题

、、、

我在Spark2.2.0闭包中使用了Json4s类。序列化DefaultFormats失败的“变通办法”是包含需要它们的定义。我相信我已经做了比下面我需要做的更多的事情，但是仍然得到序列化失败。使用Spark 2.2.0，Scala2.11，Json4s 3.2.x (Spark中的任何东西)，也尝试使用Jso

浏览 4提问于2018-01-26得票数 4

1回答

Spark streaming嵌套执行序列化问题

、、、

我正在尝试连接spark streaming应用程序中的DB2数据库和数据库查询执行语句，这会导致"org.apache.spark.SparkException:任务不可序列化“问题。请给我建议。$.clean(ClosureCleaner.scala:108) at org.apache.spark.SparkContext.clean的org.apache.spark.util.Cl

浏览 1提问于2018-03-29得票数 0

2回答

使用Apache流实时向ElasticSearch发送Kafka消息

、、、、

,timestamp,value)).saveToEs("spark/docs") ssc.awaitTermination() } 我得到了这个错误:线程"main“中的异常org.apache.spark.SparkException:作业由于阶段失败而中止:未能序列化任务2，而不是试图重试它。序列化期间的异常: java.io.NotSerializableException

浏览 9提问于2020-04-21得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

不能用滞后窗口函数串行化的星火任务

不可序列化的任务:仅对类而不是对象调用外部闭包函数时的java.io.NotSerializableException

星星之火:不使用聚合的序列化

org.apache.spark.SparkException:不可序列化的任务，wh

在Spark中使用带map的函数时任务不可序列化(Scala)

在星火中不可序列化的任务

任务不可序列化异常

Scala火花-任务不可串行化

org.apache.spark.SparkException:不可序列化的任务-传递RDD

火花驱动程序如何序列化发送给执行器的任务？

ClassTag使Spark序列化对象

scala映射函数中的"NotSerializableException“

RDD映射中的星火Scala序列化错误

Scala:不可序列化错误的任务

对象不可序列化的org.apache.spark.SparkContext。

Spark streaming:任务"predict“不可序列化

火花与卡桑德拉并行处理

Spark + Json4s序列化问题

Spark streaming嵌套执行序列化问题

使用Apache流实时向ElasticSearch发送Kafka消息

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐