前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >基于Hadoop生态圈的数据仓库实践 —— 目录

基于Hadoop生态圈的数据仓库实践 —— 目录

作者头像
用户1148526
发布2019-05-25 19:46:36
5910
发布2019-05-25 19:46:36
举报
文章被收录于专栏:Hadoop数据仓库Hadoop数据仓库

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://cloud.tencent.com/developer/article/1433228

代码语言:txt
复制
         第一部分:概述

一、什么是数据仓库

  1. 操作型系统和分析型系统
  2. ETL
  3. 数据需求
  4. 多维数据模型基础 二、在Hadoop上实现数据仓库
  5. 大数据的定义
  6. 为什么需要分布式计算
  7. Hadoop基本组件
  8. Hadoop生态圈的其它组件
  9. Hadoop生态圈的分布式计算思想
  10. 与传统数据仓库架构对应的Hadoop生态圈工具

第二部分:环境搭建

一、Hadoop版本选型

二、安装Hadoop及其所需的服务

三、建立数据仓库示例模型

  1. ERD
  2. 选择文件格式
  3. 建立数据库、表和视图

第三部分:ETL

一、使用Sqoop抽取数据

  1. Sqoop简介
  2. CDH 5.7.0中的Sqoop
  3. 使用Sqoop抽取数据 二、使用Hive转换、装载数据
  4. Hive简介
  5. 初始装载
  6. 定期装载 三、使用Oozie定期自动执行ETL
  7. Oozie简介
  8. 建立定期装载工作流
  9. 建立coordinator作业定期自动执行工作流

第四部分:进阶技术

一、增加列

二、按需装载

三、维度子集

四、角色扮演维度

五、快照

六、维度层次

七、递归

八、多路径和参差不齐的层次

九、退化维度

十、杂项维度

十一、多重星型模式

十二、间接数据源

十三、无事实的事实表

十四、迟到的事实

十五、维度合并

十六、累积的度量

十七、分段维度

第五部分:OLAP与数据可视化

一、OLAP与Impala简介

二、Hive、SparkSQL、Impala比较

三、Impala OLAP实例

四、数据可视化与Hue简介

五、Hue、Zeppelin比较

六、Hue数据可视化实例

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2016年06月25日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
专用宿主机
专用宿主机(CVM Dedicated Host,CDH)提供用户独享的物理服务器资源,满足您资源独享、资源物理隔离、安全、合规需求。专用宿主机搭载了腾讯云虚拟化系统,购买之后,您可在其上灵活创建、管理多个自定义规格的云服务器实例,自主规划物理资源的使用。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档