版权声明:本文为博主原创文章,未经博主允许不得转载。 https://cloud.tencent.com/developer/article/1433228
第一部分:概述
一、什么是数据仓库
第二部分:环境搭建
一、Hadoop版本选型
二、安装Hadoop及其所需的服务
三、建立数据仓库示例模型
第三部分:ETL
一、使用Sqoop抽取数据
第四部分:进阶技术
一、增加列
二、按需装载
三、维度子集
四、角色扮演维度
五、快照
六、维度层次
七、递归
八、多路径和参差不齐的层次
九、退化维度
十、杂项维度
十一、多重星型模式
十二、间接数据源
十三、无事实的事实表
十四、迟到的事实
十五、维度合并
十六、累积的度量
十七、分段维度
第五部分:OLAP与数据可视化
一、OLAP与Impala简介
二、Hive、SparkSQL、Impala比较
三、Impala OLAP实例
四、数据可视化与Hue简介
五、Hue、Zeppelin比较
六、Hue数据可视化实例