方法 , 又称为 map 算子 , 可以将 RDD 中的数据元素 逐个进行处理 , 处理的逻辑 需要用外部 通过 参数传入 map 函数 ;
RDD#map 语法 :
rdd.map(fun)
传入的...fun 是一个函数 , 其函数类型为 :
(T) -> U
上述 函数 类型 前面的 小括号 及其中的内容 , 表示 函数 的参数类型 ,
() 表示不传入参数 ;
(T) 表示传入 1 个参数 ;...10
rdd.map(lambda x: x * 10)
4、代码示例 - RDD#map 数值计算 ( 传入普通函数 )
在下面的代码中 ,
首先 , 创建了一个包含整数的 RDD ,
# 创建一个包含整数的...([1, 2, 3, 4, 5])
然后 , 使用 map() 方法将每个元素乘以 10 , 这里传入了 lambda 函数作为参数 , 该函数接受一个整数参数 element , 并返回 element...数值计算 ( 链式调用 )
在下面的代码中 , 先对 RDD 对象中的每个元素数据都乘以 10 , 然后再对计算后的数据每个元素加上 5 , 最后对最新的计算数据每个元素除以 2 , 整个过程通过函数式编程