首页
学习
活动
专区
工具
TVP
发布

Hadoop数据仓库

专栏作者
514
文章
711401
阅读量
108
订阅数
INSERT...ONDUPLICATEKEYUPDATE产生deathlock死锁原理讲解及解决办法
地址:【转】INSERT...ONDUPLICATEKEYUPDATE产生deathlock死锁原理讲解及解决办法_on duplicate key update死锁解决-CSDN博客
用户1148526
2024-02-02
1260
维度模型数据仓库(三) —— 准备数据仓库模拟环境
(二)准备数据仓库模拟环境         上一篇说了很多数据仓库和维度模型的理论,从本篇开始落地实操,用一个小而完整的示例说明维度模型及其相关的ETL技术。示例数据库和ETL的SQL实现是在《Dimensional Data Warehousing with MySQL: A Tutorial》基础上做了些修改,增加了Kettle实现的部分。本篇详细说明数据仓库模拟实验环境搭建过程。         操作系统:Linux 2.6.32-358.el6.x86_64         数据库:MySQL 5.6.14 for Linux 64位         Kettle:GA Release 5.1.0         实验环境搭建过程:         1. 设计ERD         2. 建立源数据数据库和数据仓库数据库         3. 建立源库表         4. 建立数据仓库表         5. 建立过渡表         6. 生成源库测试数据         7. 生成日期维度数据         源数据数据库初始ERD如图(二)- 1所示         数据仓库数据库初始ERD如图(二)- 2所示         执行清单(二)- 1里的SQL脚本完成2-7步的任务
用户1148526
2022-12-02
9620
维度模型数据仓库(二) —— 维度模型基础
        既然维度模型是数据仓库建设中的一种数据建模方法,那不妨先看一下几种主流的数据仓库架构。
用户1148526
2022-12-02
7740
Greenplum 实时数据仓库实践(3)——Greenplum与数据仓库
Greenplum是一个分布式大规模并行处理数据库,在大多数情况下适合做大数据的存储引擎、计算引擎和分析引擎,尤其适合构建数据仓库。本篇重点介绍Greenplum的系统架构和主要功能。我们先从历史演进和所采用的MPP框架对Greenplum做一个概要说明,然后描述其顶层架构,之后详细介绍存储模式、事务支持、并行查询与数据装载、容错与故障转移、数据库统计、过程化语言扩展等方面的功能特性,正是它们支撑Greenplum成为一款理想的分析型数据库产品。本篇最后简单对比Greenplum与另一个流行的大数据处理框架Hadoop,进而阐述可以选择前者的理由。
用户1148526
2021-12-07
3.7K0
使用MySQL的rlike判断字符串是否匹配
表user_experience_wealth_log改名为user_experience_wealth_log_new,该表涉及若干存储过程。为了避免遗漏,需要确认所有相关过程都做了修改,验证方法为不存在包含user_experience_wealth_log的存储过程。
用户1148526
2020-04-30
1.7K0
递归层次汇总查询
在一个数据仓库项目中,人员、组织机构、事实表是这样设计的: 组织机构是一个树形结构 每一个人员只属于一层组织机构,该层为叶子节点和非叶子节点均可 事实表存储每个人员的数据 要求按组织机构层次汇总数据,别且可下钻。 -- 建立测试表 -- 1. 组织机构 CREATE TABLE org ( org_id NUMBER, org_name VARCHAR2 (100), p_org_id NUMBER ); -- 2. 职员 CREATE TABLE emp
用户1148526
2019-05-25
8460
浅尝辄止MongoDB:GridFS
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/wzy0623/article/details/82894835
用户1148526
2019-05-25
6000
浅尝辄止MongoDB:基础
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/wzy0623/article/details/82840397
用户1148526
2019-05-25
1.6K0
快速生成日期维度数据
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/wzy0623/article/details/89051688
用户1148526
2019-05-25
1.3K0
什么是 ODS
ODS是一个面向主题的、集成的、可变的、当前的细节数据集合,用于支持企业对于即时性的、操作性的、集成的全体信息的需求。常常被作为数据仓库的过渡,也是数据仓库项目的可选项之一。
用户1148526
2019-05-25
1.2K0
Oracle聚簇表使用方针
要针对应用的要求来考虑使用聚簇的优缺点。例如,你需要确定连接语句的性能提升是否超过了修改聚簇值的性能下降,你可能还需要做实验比较聚簇和单独存储所花费的处理时间。
用户1148526
2019-05-25
5230
OushuDB入门(七)——OLAP篇
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/wzy0623/article/details/80422836
用户1148526
2019-05-25
1.1K0
HAWQ技术解析(七) —— 存储分布
        在HAWQ中创建一个表时,应该预先对数据如何分布、表的存储选项、数据导入导出方式和其它HAWQ特性做出选择,这些都将对数据库性能有极大影响。理解有效选项 的含义以及如何在数据库中使用它
用户1148526
2018-01-03
2K0
建立标准数据对照表
摘要总结:通过建立标准数据对照表,实现统一的人员信息库,提高数据一致性和准确性,并提高工作效率。
用户1148526
2018-01-03
1.2K0
Oracle 中 table 函数的应用
该文介绍了如何利用基于对象类型和基于表格类型的表函数,实现对复杂数据类型的处理。首先介绍了两种表函数的定义和实现方式,然后通过几个具体的例子,展示了如何使用这两种表函数来处理复杂数据类型,例如日期、国家、性别等。同时,文章还介绍了如何利用PL/SQL来实现这些表函数,以及如何利用这些表函数来处理大数据量的数据。
用户1148526
2018-01-03
2.3K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档