Hadoop数据仓库-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

Hadoop数据仓库

专栏成员

529

文章

772450

阅读量

110

订阅数

基于Hadoop生态圈的数据仓库实践 —— ETL（三）

网站 hadoop mapreduce php java

三、使用Oozie定期自动执行ETL 1. Oozie简介（1）Oozie是什么 Oozie是一个管理Hadoop作业、可伸缩、可扩展、可靠的工作流调度系统，其工作流作业是由一系列动作构成的有向无环图（DAGs），协调器作业是按时间频率周期性触发的Oozie工作流作业。Oozie支持的作业类型有Java map-reduce、Streaming map-reduce、Pig、 Hive、Sqoop和Distcp，及其Java程序和shell脚本等特定的系统作业。第一版Oozie是一个基于工作流引擎的服务器，通过执行Hadoop Map/Reduce和Pig作业的动作运行工作流作业。第二版Oozie是一个基于协调器引擎的服务器，按时间和数据触发工作流执行。它可以基于时间（如每小时执行一次）或数据可用性（如等待输入数据完成后再执行）连续运行工作流。第三版Oozie是一个基于Bundle引擎的服务器。它提供更高级别的抽象，批量处理一系列协调器应用。用户可以在bundle级别启动、停止、挂起、继续、重做协调器作业，这样可以更好地简化操作控制。（2）为什么需要Oozie

2019-05-25

9990

在MySQL中建立自己的哈希索引（书摘备查）

php 编程算法云数据库 SQL Server 数据库 sql

在MySQL中，只有Memory存储引擎支持显式的哈希索引，但是可以按照InnoDB使用的方式模拟自己的哈希索引。这会让你得到某些哈希索引的特性，例如很大的键也只有很小的索引。想法非常简单：在标准B-Tree索引上创建一个伪哈希索引。它和真正的哈希索引不是一回事，因为它还是使用B-Tree索引进行查找。然而，它将会使用键的哈希值进行查找，而不是键自身。你所要做的事情就是在where子句中手动地定义哈希函数。一个不错的例子就是URL查找。URL通常会导至B-Tree索引变大，因为它们非常长。通常会按照下面的方式来查找URL表：

2019-05-25

2.2K0

没有更多了

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态