首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

想成为一名合格的大数据架构师你必须要掌握这些内容!

相信现在很多做IT行业的多多少少都了解或者听说过大数据这个越来越火的名词,也有很多人想往大数据这边发展。但是接触了就会发现其实大数据很广泛,相信大家都一样,刚刚接触大数据的时候完全一头雾水,不知道该往那方面发展,怎么开始进军大数据这个行业?

Hadoop基础

1、分布式储存基石:HDFS

2、分布式计算基础:MapReduce

3、Hadoop集群资源管家:YARN

离线数据处理

1、离线日志收集利器:Flume

2、离线批处理必备工具:Hive

3、速度更快的Hive:Impala

4、更快更强更好用的MR:Spark

实时数据处理

1、流数据集成神器:kafka

2、实时计算引擎:spark streaming

3、海量数据高速存取数据库:HBase

ETL与环境相关

1、ELT神器:Sqooq,Kettle

2、任务调度双量:Oozie,Azkaaban

当真正开始学习的时候难免不知道从哪入手,学习时频繁踩坑,导致效率低下影响继续学习的信心,最终浪费大量时间。

为了让学习变得轻松、高效!今天给大家免费分享一套教学资源!

群内已经将知识体系整理好(源码,笔记,PPT,学习视频)进群免费领取!

分享给喜欢大数据,有梦想成为大数据架构师的程序员们,希望能够帮助到你们。

最后,做一个爱思考,懂思考,会思考的程序员。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181016B0DBCI00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券