前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【推荐收藏】7个小练习帮你打通SparkCore和SparkSQL编程任督二脉

【推荐收藏】7个小练习帮你打通SparkCore和SparkSQL编程任督二脉

作者头像
Sam Gor
发布2019-07-15 17:06:53
1.3K0
发布2019-07-15 17:06:53
举报
文章被收录于专栏:SAMshare

本文将通过7个简单的小练习,对比示范SparkCore和SparkSQL编程的方法。除了WordCount词频统计这个典型的处理非结构数据的例子外,本文示范的大部分例子中,使用SparkSQL的编程接口都会更加简洁易懂。

一,求平均值

问题:给定一组整数,求它们的平均值。

(注意:这些整数可能加起来会很大,要考虑溢出可能)

二,WordCount词频统计

问题:读取文档中的单词,统计每个单词出现的词数。

三,求TopN

问题:给定学生姓名和成绩等信息,找出成绩前三名的学生。

四,求最大值最小值

问题:给定一组数,找出其中的最大值和最小值。

五,排序并添加序号

问题:给定一组数,对其从小到大排序,并添加从0开始的序号。

六,二次排序

问题:给定学生的成绩和年龄等信息,根据学生的成绩从大到小排序,如果成绩相等,根据年龄从大到小排序。

七,连接操作

问题:给定班级信息表和学生成绩表,对其进行连接操作,找出班级平均分在75分以上的班级。

推荐阅读:

30分钟理解Spark的基本原理

3小时Scala入门

1小时入门Spark之RDD编程 2小时入门SparkSQL编程

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-07-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 SAMshare 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一,求平均值
  • 三,求TopN
  • 四,求最大值最小值
  • 五,排序并添加序号
  • 六,二次排序
  • 七,连接操作
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档