腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(8414)
视频
沙龙
1
回答
尝试
同时
使用
udf
和
to_json
时
出现
“
任务
不可
序列化
:
java.io.NotSerializableException
”
、
、
、
、
我一直在
尝试
找出确切的问题所在,但无法做到。
尝试
遵循类似的东西,也是
UDF
to generate JSON string behaving inconsistently,但仍然无法理解问题。value).as("value")) //combination of this two line doesn't work either // .withColumn("value",
to_json
('value).as
浏览 22
提问于2020-09-15
得票数 0
回答已采纳
1
回答
不
使用
外部变量的
UDF
[Java]
、
、
我正在
尝试
执行以下代码。 return df;当我执行这段代码
时
,它会抛出一个错误 User类抛出异常: org.apache.spark.SparkException:
任务
不可
序列化
。原因:
java.io.NotSeri
浏览 3
提问于2020-04-07
得票数 1
1
回答
在Spark中调用
UDF
方法中的其他方法/变量
、
、
、
我有一个Spark,其中我试图调用一个
UDF
[它是我
使用
Spark
udf
创建的。val udfName =
udf
(somemethodName)我正在
尝试
使用
另一个作为val存储在somemethodName中的DF,但是DF以null的形式
出现
。只有当我在newDF中
使用<
浏览 1
提问于2016-11-23
得票数 0
1
回答
org.apache.spark.SparkException:
任务
不可
序列化
,除实现java.io.Serializable之外的任何其他解决方案
、
当我在我的spark(用java编写)应用程序中
使用
UDF
函数
时
,我得到了这个错误。org.apache.spark.util.ClosureCleaner$.ensureSerializable(ClosureCleaner.scala:403):
任务
在org.apache.spark.SparkException处
不可
序列化
...由:类: jp.co.nec.necdas.commons.customize.service.dataset.ALMTriggerProcessLogic
浏览 0
提问于2019-10-17
得票数 0
3
回答
在Spark
UDF
中操作数据帧
、
、
、
我有一个从dataframe过滤
和
选择值的
UDF
,但它遇到了"object not serializable“错误。详情见下文。我想要根据来自另一个dataframe df2的匹配的"ID“
和
"Value”对"Y“列的子集求和。("Result", callUDF("
udf
_test", $"ID", $"Value"))
java.io.NotSerializableE
浏览 20
提问于2018-02-21
得票数 3
回答已采纳
1
回答
使用
spark Java的序列文件读取问题
、
、
、
我正在
尝试
读取由hive
使用
spark生成的序列文件。当我
尝试
访问该文件
时
,我面对的是org.apache.spark.SparkException:作业由于阶段故障而中止:
任务
不可
序列化
:
java.io.NotSerializableException
: 我已经
尝试
了解决这个问题的办法,比如让类可
序列化
,但我仍然面临着这个问题。
浏览 4
提问于2017-05-04
得票数 1
1
回答
詹金斯:
java.io.NotSerializableException
: groovy.util.slurpersupport.NodeChild
、
我有读取pom.xml文件的代码,然后
尝试
重新
序列化
并将其写回: writeFile文件: pomFileOut,文本: pomXMLTextOut // <--这一行崩溃
时
出现</em
浏览 4
提问于2016-12-15
得票数 1
1
回答
在
使用
openfeign的vaadin 8的spring boot应用程序中抛出Hazelcast异常
、
、
、
我们有一个带有Vaadin 8,Spring Boot 2.1.3
和
Open Feign的web应用程序。问题是:
java.io.NotSerializableException
: java.lang.r
浏览 3
提问于2019-04-04
得票数 1
1
回答
为什么光束AvroIO不能
使用
运行时参数,以及如何在数据流模板中
使用
AvroIO?
、
、
、
我试图将数据流中的运行时参数与AvroIO结合
使用
,结果却遇到了
序列化
问题(
java.io.NotSerializableException
: org.apache.avro.Schema$RecordSchema然后我发现这个页面底部的表格中缺少AvroIO: 我猜这是由于一些Avro类的
不可
序列化
,是真的吗?有没有解决这个问题的计划?如果没有,如果我需要在写入Avro文件的模板中
使用
运行时参数,我应该如何做?我是否必须放弃模板,并以某种方式让我的服务在每次需要
时
以标
浏览 3
提问于2017-07-07
得票数 0
1
回答
Spark RDD tuple字段需要
序列化
吗?Mahout Drm似乎说不
、
、
、
Mahout的DrmRdd类型定义为这可以翻译为但是,Mahout文档清楚地指出Vector类是
不可
序列化
的这让我很头疼,关于如何生成RDD(K,Vector)来包装到Mahout Drm中,而不会因为Vector
不可
序列化
的事实而被绊倒。 我的问题是,spark RDD tuple什么时候需要可
序列化
?或者,它们是否只需要对某些需要通过shuffle传递的函数可
序列化
?
浏览 15
提问于2016-07-29
得票数 0
回答已采纳
1
回答
Spark
任务
不可
序列化
、
、
、
在生产中
使用
Java 7,在开发中
使用
Java 7/8。 我们需要几个DataFrame转换,我们认为通过Spark对内存中的DataFrame DataFrame编写一个
UDF
将完成这项工作。这在sqlContext中没有包含
UDF
调用的情况下运行良好,但是一旦它们被添加,我们就会得到“
任务
不是可
序列化
的”错误。线程"main“org.apache.spark.SparkException中的异常:
不可
序列化
的
任务</em
浏览 3
提问于2016-03-23
得票数 1
回答已采纳
3
回答
Spark函数与
UDF
性能?
、
、
、
、
Spark现在提供了可以在数据帧中
使用
的预定义函数,而且它们似乎是高度优化的。我最初的问题是哪个更快,但我自己做了一些测试,发现spark函数至少在一个实例中快了10倍。有没有人知道为什么会这样,什么时候
udf
会更快(只有在存在相同的spark函数的情况下)?下面是我的测试代码(在Databricks社区版上运行):from faker import Factoryconcat_s =
udf
(lambda s:
浏览 26
提问于2016-07-11
得票数 58
回答已采纳
2
回答
使用
MySQL STL功能编写C++
UDF
、
、
MySQL文档()中有一条语句困扰着我:这是否意味着我注定要
使用
普通的老C来编写我的
UDF
??
浏览 1
提问于2009-04-08
得票数 2
回答已采纳
7
回答
Scala中的Apache火花日志记录
、
、
我正在寻找一种解决方案,以便在Apache节点上执行代码
时
能够记录额外的数据,这可能有助于以后研究在执行过程中可能
出现
的一些问题。例如,
尝试
使用
像com.typesafe.scalalogging.LazyLogging这样的传统解决方案会失败,因为日志实例不能在像Apache这样的分布式环境中
序列化
。我想知道--它们是否是我可以
使用
的已知的日志记录解决方案,并允许我在Apache节点上执行RDD
时
记录数据? @嗣后编辑:下面的一些评论建议
使用
Log4
浏览 4
提问于2015-03-23
得票数 69
2
回答
java.io.NotSerializableException
: javax.swing.GroupLayout
、
、
我有这段代码,它会抛出异常代码如下 package basededatosmuebleria
浏览 1
提问于2018-05-21
得票数 0
回答已采纳
7
回答
java.io.NotSerializableException
即使我实现了"Serializable“
、
、
、
我有一个小问题:我想在android上测试
序列化
(
使用
eclipse),并找到了一个如何做到这一点的示例。我知道我需要在我想要
序列化
的类中实现"Serializable“,我已经这样做了,并且总是得到一个
java.io.NotSerializableException
异常。} catch(IOException ioe) { Log.e("serializeObject", "error", ioe); //&quo
浏览 11
提问于2011-11-22
得票数 7
2
回答
java.io.NotSerializableException
:在有条件地创建新列
时
,
使用
UDF
映射
时
的org.apache.spark.sql.Column
、
、
、
我有一个设备ID与startTime
和
一些特征向量的数据,这些数据需要基于hour或weekday_hour进行合并。当我
尝试
以以下方式创建键列
时
: val columnMap = Map("hour" -> hour($"startTime"), "weekday_hour" -> getWeekdayHourUDF- object (class scala.collection.immutable.Map$Map3, Map(hour -> hour(star
浏览 1
提问于2018-03-15
得票数 2
回答已采纳
1
回答
avro对象不能
序列化
为Map - Spark的值
、
、
Spark无法在MapString,AvroObj中
序列化
avro对象,即使我
使用
avro-1.8.0使avro对象可
序列化
之后也是如此。scala.collection.mutable.HashMap)我怀疑模式$属性仍然是
不可
序列化
的,但是当我在闭包中单独
使用
AvroObj
时
,一切工作正常。请注意,我
使用
的是KryoRegistrat
浏览 2
提问于2016-06-23
得票数 1
4
回答
星星之火sql --无论是
使用
行转换还是
使用
UDF
。
、
、
、
我有一个输入表(I),其中包含100列
和
1000万条记录。
使用
我猜在列级别上工作的
UDF
,即以I的现有列作为输入,并生成相应的O列之一,即
使用
50个
UDF
函数。我想知道上述2中哪一个更有效率(更高的分布
和
并行处理),以及为什么或如果它们具有同样的速度/性能,因为我正在处理整个输入表I并产生全新的输出表O,即它是一个批量数据处理。
浏览 12
提问于2017-04-14
得票数 20
3
回答
在芹菜
任务
中
使用
多进程并发机制
、
、
我正在
尝试
与一个只能接受单个TCP连接(内存限制)的设备进行交互,因此不能像正常的客户端-服务器情况那样为每个工作线程启动一个连接,例如数据库连接。我
尝试
过
使用
Multiprocessing Manager字典,它可以在线程之间全局访问,格式为:_pickle.PicklingError: Can't pickle <c
浏览 0
提问于2016-03-24
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
PyFlink核心功能与应用全解
Spark 2.4重磅发布:优化深度学习框架集成,提供更灵活的流式接收器
java集合学习之List引申出来的一些东西(一)序列化Serializable接口
Hive3连接RDBMS和使用函数
WebAssembly 正在吞噬数据库!
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券