腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如
何在
Java
中
创建
ClassTag
<
Dataset
<
Row
>>
、
、
、
final Broadcast<
Dataset
<
Row
>> b = sparkSession.sparkContext().broadcast(
classTag
(
Dataset
.class)createTag方法: private static <T>
ClassTag
<T>
class
浏览 21
提问于2019-10-30
得票数 0
2
回答
Spark无法将fromTuple转换为
Row
和Dataframe
、
、
我正在尝试从
Dataset
<
Row
>对象
创建
JavaRDD<Tuple2<
Row
,
Row
>>对象。我遵循以下步骤, 使用toDataset()函数的sqlContext与模式转换为数据集。但是,在第一步
中
,我无法在代码中使用像scala这样的
Row</e
浏览 5
提问于2020-06-26
得票数 4
回答已采纳
1
回答
线程“broadcast 0”
java
.lang.OutOfMemoryError
中
的异常:内存不足,无法构建表并将表广播到所有工作节点。
、
、
、
(ThreadPoolExecutor.
java
:1142) at
java
.lang.Thread.run(Thread.
java
:745) 作为解决办法,您可以通过将spark.sql.autoBroadcastJoinThreshold
Dataset</em
浏览 1
提问于2018-08-27
得票数 2
回答已采纳
1
回答
如何将HashMap放在BroadCast变量
中
?
、
我正在尝试将HashMap放在BroadCast变量
中
,但是在错误以下在下面的代码片段
中
Broadcast<HashMap<static <T>
ClassTag
<T
浏览 3
提问于2022-01-07
得票数 1
1
回答
创建
空的dataframe
Java
Spark
、
、
关于如何使用Spark Scala/Python
创建
空的dataframe/
Dataset
,有很多示例。但是我想知道如
何在
Java
Spark
中
创建
一个空的dataframe/
Dataset
。我必须
创建
一个空的dataframe,其中只有一列,标题为Column_1,类型为String。
浏览 27
提问于2020-07-14
得票数 0
回答已采纳
1
回答
Java
:线程"main“
java
.lang.RuntimeException:无法找到默认KieBase
中
的异常
、
、
、
<KieBase> classTagTest = scala.reflect.
ClassTag
$.MODULE$.apply(KieBase.class);在这里,finalJoined是
Dataset
<
Row
>类型 public static void droolprocess(KieBase base,
Row
row</e
浏览 1
提问于2018-06-15
得票数 0
回答已采纳
3
回答
如何从
Java
字符串数组
创建
Spark广播变量?
我有一个
Java
字符串数组,它包含45个字符串,基本上就是列名目前,我将上述字符串数组存储在Spark驱动程序的静态字段
中
。我在
创建
DataFrame时使用了上面的字符串数组我想使用广播变量来做上面的事情,这样它就不会将巨大的字符串数组传递给每个执行器我相信我们可以像下面这样做来<
浏览 0
提问于2015-09-12
得票数 3
回答已采纳
2
回答
行类型Spark数据集的编码器
、
、
、
、
我想为
DataSet
中
的类型编写一个编码器,用于我正在执行的映射操作。从本质上讲,我不知道如何编写编码器。<
Row
> @Overridejoin.schema(); }
浏览 7
提问于2017-04-06
得票数 29
回答已采纳
3
回答
如
何在
Spark中使用RangePartitioner
、
、
、
我想在我的
Java
Spark应用程序中使用RangePartitioner,但是我不知道如何设置两个scala参数scala.math.Ordering<K> evidence$1和scala.reflect.
ClassTag
浏览 17
提问于2015-06-09
得票数 8
1
回答
Scala在数据和数据集中对Double.NaN的处理方式不同
、
、
、
、
在测试
中
,我试图将数据/数据集转换为集合并进行比较。例如。在Scala
中
,Double.NaN == Double.NaN返回false。 println(
dataSet
.collect.toSet ==
dataSet
.collect.toSet) //false, why?它是如
何在
代码中发生
浏览 1
提问于2020-09-15
得票数 2
回答已采纳
4
回答
如何使用
java
从Spark
中
的列表或数组
创建
行
、
、
在
Java
语言中,我使用RowFactory.create()
创建
一个
Row
:其中“记录”是数据库
中
的一条记录,但我不能预先知道“记录”的长度,所以我想使用列表或数组来
创建
“行”。在Scala
中
,我可以使用
Row
.fromSeq()从列表或数组
创建</e
浏览 70
提问于2016-09-26
得票数 8
1
回答
如
何在
Java
中
创建
对象集合Spark
Dataset
?
、
、
、
其中
Dataset
用作对象的分布式集合。 我担心的不是它是如何分布的,而是一个基本的数据结构。如果我
创建
了自己的数据集,我很想知道它是如何放在
java
中
的。 它看起来像这个
Dataset
<
Row
>。其中
Row
是记录,可以是多个。这就是
创建
Dataset
<
Row
>工作方式 List<
Row
> rows = new ArrayList<
Row
&
浏览 48
提问于2020-06-10
得票数 1
1
回答
传入参数的匿名方法
、
、
、
、
我已经在Pregel
中
创建
了一个方法,它具有以下签名:A<VD> arg7, 如图所示,我正在调用该方法:但我面临以下错误 The method apply(Graph<<VD>,
ClassTag
&
浏览 3
提问于2017-10-02
得票数 0
1
回答
星星之火执行每一个动作两次。
、
、
、
我
创建
了一个简单的
Java
应用程序,它使用Apache从Cassandra检索数据,对其进行一些转换,并将其保存在另一个Cassandra表
中
。(reportTime.getTime()),
classTag
(
java
.sql.Timestamp.class));
如
您所见,每个操作都执行两次。 我做错了什么吗?有什么我错过的场景吗
浏览 1
提问于2015-11-17
得票数 4
2
回答
如何使用case类类型参数
创建
数据集?(找不到T型编码器)
、
、
、
我正在尝试从T类型的RDD
创建
一个数据集,该类已知是一个case类,作为函数的参数传递。问题是,推论编码器不适用于这里。如何将类型参数设置为能够
创建
数据集?我尝试过将T设置为T:
ClassTag
或使用implicit
ClassTag
,但这并没有帮助。如果我使用提供Type的代码,它可以工作,所以我想传递的特定类类型(基本案例类)没有问题。在我的用例
中
,我在函数
中
做其他的事情,但这是基本的问题。def createDatasetFromRDD[T](rdd: RDD[T])(impli
浏览 0
提问于2019-08-01
得票数 1
回答已采纳
1
回答
在Scala
中
创建
具有任意类型和映射的三维数组
、
、
、
当我们在Scala中有一个任意类型为X的数组,并且我们试图使用map对它的每个值进行双重嵌套(也就是将[1,2,3]转换为[[[1]],[[2]],[[3]]]),我们就得到了一个
java
.lang.ArrayStoreException下面的代码是一个最小的失败示例:import scala.
浏览 14
提问于2018-08-20
得票数 3
回答已采纳
2
回答
HashMap作为星火流
中
的广播变量?
、
、
分类键值在HashMap
中
的程序开始时加载.因此,需要将每个传入的数据包与这些密钥进行比较,并相应地进行标记。如
何在
所有使用HashMap的火花工作者上共享我的HashMap。或者,是否有更好的方法来做到这一点? 我正在用
Java
编写火花流应用程序的代码。
浏览 0
提问于2015-06-10
得票数 8
回答已采纳
1
回答
在数据集Apache Spark上应用转换
、
、
我正在使用
Java
语言处理Apache Spark
中
的
Dataset
<
Row
>,需要对此
Dataset
中
的所有列进行一些数学转换。基本上,其中一个转换是获取存储在此数据集中的所有值的日志,并仍然返回
Dataset
<
Row
>。我清楚地知道如
何在
RDD
中
的map函数
中
执行此操作,但是如
何在
Dataset
<
Row
><
浏览 0
提问于2017-01-04
得票数 1
1
回答
如
何在
java
中
获取scala的TypeTag和
ClassTag
、
我正在编写
Java
代码,其中需要调用Scala函数,该函数的定义如下:我不知道如
何在
java
中生成arg1和arg
浏览 30
提问于2016-07-26
得票数 2
回答已采纳
1
回答
Scala群按元素类型
、
、
、
我编写了一个文本分析器,它使用n个解析器(通过对n个示例进行培训生成)解析给定的文本,这些解析器包含类型的列表。注意,每个对象都有参数(假设在本例中所有对象都有相同的参数名为param),其值可能会有所不同。我的目标是减少列表以删除公共解析器(即具有相同参数的对象),以便进一步处理和使用。为了实现同样的目标,我正在考虑对相同类型的元素进行分组,然后减少这些组的数量。但是,我不确定如何使用类型进行groupBy。相同的任何建议/指针都会有帮助(或者
浏览 3
提问于2015-09-03
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Spark之SparkSQL
Spark SQL,DataFrames 以及 Datasets 编程指南
教你学会物体检测
好消息!Python和Excel终于可以互通了!
Java机器学习加速器:用Spark MLlib快速打造高效模型
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券