前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Transformation转换算子之双Value类型交互

Transformation转换算子之双Value类型交互

作者头像
用户1483438
发布2022-04-27 14:59:15
2030
发布2022-04-27 14:59:15
举报
文章被收录于专栏:大数据共享大数据共享

intersection()交集

对源RDD和参数RDD求交集后返回一个新的RDD

交集
交集

交集:只有3

案例演示

结果

union()并集

对源RDD和参数RDD求并集后返回一个新的RDD

并集
并集

并集:1、2、3全包括

结果

subtract()差集

计算差的一种函数,去除两个RDD中相同元素,不同的RDD将保留下来

差集
差集

差集:只有1

案例演示:

求算:rdd1的差集

结果

求算:rdd2的差集

结果

zip()拉链

该操作可以将两个RDD中的元素,以键值对的形式进行合并。其中,键值对中的Key为第1个RDD中的元素,Value为第2个RDD中的元素。 将两个RDD组合成Key/Value形式的RDD,这里默认两个RDD的partition数量以及元素数量都相同,否则会抛出异常。

案例:相亲配对

结果

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文系转载前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • intersection()交集
  • union()并集
  • subtract()差集
  • zip()拉链
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档