课程介绍:
本课程从安装到linux系统配置,从简单命令到复杂命令,逐步深入。对hadoop的核心概念,核心模块hdfs和yarn;对mapreduce的重要知识点、运行方式和shuffle的复杂过程;对hive的架构、多种模式的安装和hive的hql语句;hive中的高级查询语句使用;hive中常用内部函数详解等知识点进行了详细讲解。
课程详解:
第一章 linux基础和shell脚本
Day01:linux介绍和环境搭建
Day02:linux相关命令介绍1
Day03:linux相关命令介绍2
Day04:linux系统下软件安装
Day05:shell编程
第二章 hadoop、hdfs、zookeeper和hadoop的高可用
Day06:hadoop的简介和单机版安装
Day07:hdfs的理论讲解
Day08:yarn的理论讲解
Day09:hadoop的伪分布式和分布式搭建
Day10:hdfs的shell命令和hdfs api01
Day11:hdfs的api02和rpc
Day12:zookeeper的讲解
Day13:hadoop的高可用
第三章 分布式并行离线计算框架Mapreduce
Day14:mr的理论讲解和wordcount案例
Day15:mr的基本数学运算和awk脚本案例比较
Day16:mr的shuffle过程、partitioner、combiner、去重、倒排索引
Day17:mr的secondarySort、topN、自定义数据类型、单表连接、多表连接
Day18:mr的chain、oldAPI、简单案例
Day19:mr自定输入输出数据类型编写
第四章 数据仓库工具hive
Day20:hive的介绍、安装和简单命令
Day21:hive的高级查询
Day23:hive的复杂类型和内部函数
Day24:hive的udf编写
Day25:hive的存储格式、serde、索引、视图、优化
Day26:sqoop介绍、安装和sqoop语句编写
第五章 分布式数据库Hbase
Day27:Hbase介绍、伪分布式安装、全分布式安装和简单命令
Day28:Hbase的api和filter
Day29:Hbase和hive的整合、Hbase和mapreduce的整合
Day30:flume的介绍、安装、和flume脚本编写
Day31:flume高级脚本编写
更多课程视频资料,请私信CoCo酱!
领取专属 10元无门槛券
私享最新 技术干货