入门阶段,跟着敲一遍就好。实践部分建议把 basic 的过一遍。
基本上把上面两个网站撸完,Scala就差不多了。scala还是和Python挺像的。
为什么要学Scala,因为不想用Python去写Spark
首先需要掌握的就是SQL语法和Scala语法,然后就跟着官网案例去敲代码,了解RDDs,DataFrame、Datasets的基本操作。如果公司有实际项目,跟着过一遍,就会好很多,我现在就处于这个阶段,欢迎和我交流。
我会把学习Spark的过程都放在这个repo里:learning-spark
微信没链接,可以在阅读原文中找到
本文分享自 Python爬虫与算法进阶 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!