腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
将
RDD
与
数组
值
配对
尝试
将
RDD
从下面的格式展平。
rdd
=((key),((value1,value2),Some((value3,value4)))) (key,value1,value2,value3,value4)case class outdata(Key: String, Value1: String, Value2: String, Value3:String, Value4:String)
rdd
.map
浏览 0
提问于2019-07-16
得票数 0
1
回答
将
每个
RDD
值
与
scala中
RDD
中的所有其他
值
配对
、
我试图
将
RDD
中的每个
值
与
相同
RDD
的所有其他
值
配对
。但我想不出正确的解决办法。从上面的图片: 用户2级到达..。
浏览 0
提问于2017-03-31
得票数 1
回答已采纳
2
回答
spark
rdd
如何扁平键-
数组
(
值
)对
、
、
我有一个公园
配对
的
rdd
(密钥,
数组
(value1,value2,value3.....))。我应该写什么scala语句?我怎样才能展平这个
rdd
并创建一个新的
rdd
:(key,value1),(key,value2),(key,value3)....
浏览 0
提问于2017-04-01
得票数 0
4
回答
RDD
和Pair
RDD
的区别和用例
我刚开始接触spark,并试图理解普通
RDD
和
配对
RDD
之间的区别。使用成对
RDD
而不是普通
RDD
的用例有哪些?如果可能,我想通过一个例子来了解pair
RDD
的内部结构。谢谢
浏览 1
提问于2016-05-06
得票数 15
1
回答
在Spark中将元组转换为矩阵
、
、
我有一个元组和
值
的
rdd
列表,如下所示。有成千上万种不同的
配对
。(A, B), 1(C, D), 1(D, A), 5 我希望
将
元组
值
对转换为
与
这些元组
值
对对应的矩阵。
浏览 28
提问于2020-08-12
得票数 0
回答已采纳
1
回答
将
Pyspark Python k-means模型预测插入到具有原始
RDD
项和要素的DF中
、
、
、
我有一个
Rdd
与
ID和功能。简而言之,我试图输出一些
与
标签("id")和它所属的簇号(0,1,2等)相匹配的内容。我通过创建一个只包含这些特性的
RDD
来运行这个模型的特性( id破坏了直接在原始
RDD
上运行的模型):model =我想以某种方式
将
id
与
预测结合在一起,这样我就可以报告哪些id属于哪个集群。我找不到一个很好的方法来做这件事。我尝试<em
浏览 3
提问于2019-05-13
得票数 1
1
回答
为什么spark的数据集中没有reduceBykey
、
、
在此中,大多数答案都介绍了groupByKey + reduceGroups策略。然而,我没有发现任何关于为什么spark删除reduceByKey接口的评论。有评论说,Spark的Catalyst Optimizer可以降低一些计算,这可能解释了为什么。然而,根据作者和我的测试,Dataset的groupByKey + reduceGroups策略比reduceByKey慢得多。
浏览 45
提问于2019-08-05
得票数 0
回答已采纳
1
回答
根据字符列表创建一对RDDs
、
、
、
我正在尝试创建一个
配对
的
RDD
,其中键将来自一个
RDD
,并且所有的
值
都是1。 因此,例如,如果有人要导入字符串"hello world!"并将其并行化为
RDD
,则输出为:('h', 1), ('e', 1), ('l', 1), ('l', 1),...。我也尝试使用for循环,但是在
RDD
上迭代时收到了一个错误。
浏览 5
提问于2021-02-28
得票数 0
回答已采纳
1
回答
PySpark中基于
值
相等的密钥/
值
对的
RDD
过滤
、
、
、
、
Carroll', 4), ('is', 10), ('of', 596), ('anywhere', 3), [('Project', 10), ('is', 10)] 我试着
浏览 4
提问于2020-04-25
得票数 0
回答已采纳
1
回答
在Spark中使用Scala连接两个RDDs
、
、
、
)])]第二这里,Long再次表示给定点的索引,Double表示其局部可达性密度
RDD
[(Index:Long, Array[(NeighborIndex:Long,LocalReach
浏览 4
提问于2017-02-09
得票数 0
2
回答
在Pyspark中连接两个具有多脉冲
值
的In,并基于join添加额外的
值
?
、
、
、
、
我创建了2个
RDD
's,如下所示:
rdd
1 = sc.parallelize([(u'176', u'244', -0.03925566875021147), (u'28', u'244', 0.91751065157092051.1636548589189926), (u'165', u'275', -1.026158464467282), (u'181', u'275', 0.6685
浏览 0
提问于2018-06-25
得票数 0
2
回答
在RDDs中操作向量和列表
、
、
、
我是Spark和Scala新手,在以下
RDD
转换方面我确实需要一些帮助:简而言之,我已经有一个按键(macAddress)分组的
rdd
,其中包含成对的
值
列表。我需要将列表的向量转换为包含从列表中计算出来的
配对
差异的向量(第二元素-第一元素)。向量中的
配对
浏览 3
提问于2016-11-08
得票数 0
回答已采纳
2
回答
在奇数长度
数组
中寻找未
配对
数
、
、
密码OddOccurrencesInArray: 给出了一个由N个整
数组
成的非空
数组
A.
数组
包含一个奇数的元素,
数组
中的每个元素都可以
与
具有相同
值
的另一个元素
配对
,除了一个未
配对
的元素。例如,在
数组
A中, A = 9 A = 3 A = 9 A = 3 A =9 A = 7 A =9 ·在索引0和2处的元素有
值
9,在索引1和3的元素有
值
3,在索引4和6的元素具有
值</em
浏览 0
提问于2019-07-19
得票数 3
回答已采纳
1
回答
将
cassandra行
RDD
转换为元组
数组
、
、
我尝试从cassandra表中读取数据并将
值
存储在
数组
中。我的
RDD
如下所示如何
将
这些
值
存储到没有列名的
数组
中?
浏览 0
提问于2015-11-06
得票数 0
0
回答
迭代
RDD
而不对其进行任何更改
、
、
所以我有一个
RDD
,这个
RDD
与它元素的索引
配对
在一起。我想简单地迭代它(或者如果有一个很好的Spark函数来做这件事),并通过比较相邻元素的一个
值
来检查它们。如果相邻的元素完成了这个检查,我想记下它们在一个不同的非
RDD
结构中的索引,可能是一个ListBuffer。 这是不是可以使用某种Spark特殊函数,或者我必须手动迭代它,然后我如何迭代它?
浏览 2
提问于2017-12-01
得票数 0
回答已采纳
1
回答
rdd
上具有累加器的循环
、
、
我想循环n次,其中n是同一
rdd
上的累加器val key = keyAcm.value.toIntval combined =
rdd
.filter(k => (k._1 == key) || (k._1 == key + 1))并保留了键0(累加器的初始
值
)和1。然后,我尝试合并它的第二个参数,并更改键以创建一个新的
rdd
,其中包含键0和一
浏览 1
提问于2018-09-12
得票数 0
1
回答
火花阵列键,
值
、
、
目前,我有一个具有
数组
的
RDD
,该
数组
存储一个键值对,其中键是
数组
的2D索引,
值
是该位置的数字。例如,((0,0),1),((0,1),2),((1,0),3),((1,1),4),我想将每个键的
值
与
周围的
值
相加。
与
前面的示例相比,我希望
将
1,2,3相加,并将其放在(0,0)键值点中。
浏览 3
提问于2015-06-19
得票数 0
1
回答
如何对字符串
数组
中的项?
、
、
、
、
我有一个长长的字符串
数组
列表的“动物”,我需要关联一个代码号码。一旦通过我的旋转器选择了“动物”,这个
值
就会存储在一个变量中。我还希望将相关的代码号存储在它自己的变量中。如何创建这种“
配对
”,而不需要编写大量if/然后的代码。我可以在strings.xml文件中执行包含字符串
数组
的任何操作吗?“狗”
与
代码
配对
:"111“”猫“
与
代码
配对
:'222”“老鼠”
与
代码
配对
:“333”
浏览 3
提问于2022-10-21
得票数 0
回答已采纳
2
回答
如何在PySpark中从单个元素的
RDD
创建成对
RDD
?
、
、
、
我正在
将
文本加载到
RDD
中。然后我把它清理干净。
rdd
1 = sc.textFile("sometext.txt") import string lines = lines.lower=
rdd
1.flatMap(Func)
rdd
3 =
rdd
2.filter(lambda x: x not
浏览 21
提问于2019-04-27
得票数 0
1
回答
如何在
RDD
中传递计算
值
?-Apache火花
、
解决了:这个问题没有很好的解决方案,
将
变量-pass为
RDD
-get调整变量 变量b=2我想要做的是通过执行以下操作获得
值
2+0 + 2+0+1 +2+0+1+2+ 2+0+1+2+3 = 18,即
值
18问题是,对于每一个i,我都需要将b
值</em
浏览 2
提问于2015-03-23
得票数 0
回答已采纳
点击加载更多
相关
资讯
利用Python实现数组元素值包含特定字符的筛选与处理
将企业文件共享解决方案与数据丢失防护配对
VBA数组与字典解决方案第27讲:两列数据相互去掉重复值后合并
Spark 核心编程RDD 行动算子
Spark源码和调优简介 Spark Core
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券