方法对数据进行转换, 一个输入转换为0或多个输出, 所以回调返回一个序列
mapPartitions 多对多. 数据转换批量....多个 V 转换为一个, 类型不变.将相同 key 的 value 通过自定义函数合成, 返回一个新的 (K, V) 数据集, 此时所有的相同 key 已经合并在一起了.
foldByKey 多个 V...转换为一个, 类型不变, 可设初始值将相同 key 的 value, 通过自定义函数合并为一个....与reduceByKey的区别是, 此函数可以设置一个初始值
aggregateByKey 多个 V 转换为一个, 类型可变, 可设初始值.针对(K, V)数据集, 将相同 key 的元素聚合为一个....返回合并后的元素序列, 若其中一个数据集没有, 用 None 占位数据集1内容: (K1, V1)数据集2内容: (K1, V2), (K2, V3)结果: (K1, (V1, V2)), (K2, (