首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >【推荐收藏】7个小练习帮你打通SparkCore和SparkSQL编程任督二脉

【推荐收藏】7个小练习帮你打通SparkCore和SparkSQL编程任督二脉

作者头像
Sam Gor
发布2019-07-15 17:06:53
发布2019-07-15 17:06:53
1.3K0
举报
文章被收录于专栏:SAMshareSAMshare

本文将通过7个简单的小练习,对比示范SparkCore和SparkSQL编程的方法。除了WordCount词频统计这个典型的处理非结构数据的例子外,本文示范的大部分例子中,使用SparkSQL的编程接口都会更加简洁易懂。

一,求平均值

问题:给定一组整数,求它们的平均值。

(注意:这些整数可能加起来会很大,要考虑溢出可能)

二,WordCount词频统计

问题:读取文档中的单词,统计每个单词出现的词数。

三,求TopN

问题:给定学生姓名和成绩等信息,找出成绩前三名的学生。

四,求最大值最小值

问题:给定一组数,找出其中的最大值和最小值。

五,排序并添加序号

问题:给定一组数,对其从小到大排序,并添加从0开始的序号。

六,二次排序

问题:给定学生的成绩和年龄等信息,根据学生的成绩从大到小排序,如果成绩相等,根据年龄从大到小排序。

七,连接操作

问题:给定班级信息表和学生成绩表,对其进行连接操作,找出班级平均分在75分以上的班级。

推荐阅读:

30分钟理解Spark的基本原理

3小时Scala入门

1小时入门Spark之RDD编程 2小时入门SparkSQL编程

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-07-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 SAMshare 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一,求平均值
  • 三,求TopN
  • 四,求最大值最小值
  • 五,排序并添加序号
  • 六,二次排序
  • 七,连接操作
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档