前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >下周开怼——Spark sql源码分享

下周开怼——Spark sql源码分享

作者头像
数据仓库践行者
发布2022-03-15 08:39:40
5811
发布2022-03-15 08:39:40
举报
文章被收录于专栏:数据仓库践行者

周末开始紧张筹备啦

整了一个干净的mac电脑

从0装一遍spark sql源码环境

重新走一遍流程,写个最新的文档,给群里的小伙伴用

这次分享用的是git上最新的spark branch3.2

有同学不会scala,从网上找了免费的scala视频,链接已经放在了知识星球的置顶帖,下周要跟的同学,得提前看看

其实还好啦,我也不懂scala,俺是边看spark源码边学的scala,现在回想一下,spark sql源码中用的多且相对难理解的用法有下面几个:

1、偏函数

比如:transformUp、transformDown

2、柯里化

比如:ParseDriver中的parse方法

3、case模式匹配

用的最多,解析规则、优化器中会经常用到

4、case类

LogicalPlan、SparkPlan都是case类

5、product类

TreeNode继承product类,通过Product类中的方法(productArity、productElement、productIterator)来操纵TreeNode实现类的参数

6、scala隐式转换

比如:AstBuilder导入ParserUtils

7、foldLeft

规则执行器RuleExecutor

大家在学习scala时,重点关注一下就ok!

写文章时,刚刚看到源码编译成功啦

emmm...... 下周开怼,有点激动~~

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-03-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据仓库践行者 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 周末开始紧张筹备啦
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档