2.宽操作
二.常见的转换操作表 & 使用例子
0.创建一个示例rdd, 后续的例子基本以此例展开
1....`persist( )
前言
提示:本篇博客讲的是RDD的操作中的转换操作,即 RDD Transformations
主要参考链接:
1.PySpark RDD Transformations with...由于RDD本质上是不可变的,转换操作总是创建一个或多个新的RDD而不更新现有的RDD,因此,一系列RDD转换创建了一个RDD谱系。...)]
3.filter()
一般是依据括号中的一个布尔型表达式,来筛选出满足为真的元素
pyspark.RDD.filter
# the example of filter
key1_rdd..., (10,1,2,4)]
[(20,2,2,2), (20,1,2,3)]
4.union()
类似于sql中的union函数,就是将两个RDD执行合并操作;
pyspark.RDD.union