cwl_Java

1767 篇文章
36 人订阅

Hive

cwl_java

快速学习-Hive企业级调优

Fetch 抓取是指,Hive 中对某些情况的查询可以不必使用 MapReduce 计算。例如:SELECT * FROM employees;在这种情况下,H...

4520
cwl_java

快速学习-Hive 安装

(3)修改 apache-hive-1.2.1-bin.tar.gz 的名称为 hive

5530
cwl_java

快速学习-HBaseAPI操作

通过HBase的相关JavaAPI,我们可以实现伴随HBase操作的MapReduce过程,比如使用MapReduce将数据从本地文件系统导入到HBase的表中...

6210
cwl_java

快速学习-Hive 基本概念

Hive:由 Facebook 开源用于解决海量结构化日志的数据统计。 Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张表...

3910
cwl_java

快速学习-Hive 数据类型

对于 Hive 的 String 类型相当于数据库的 varchar 类型,该类型是一个可变的字符串,不过它不能声明其中最多能存储多少个字符,理论上它可以存...

3920
cwl_java

快速学习-DDL数据定义

1)创建一个数据库,数据库在 HDFS 上的默认存储路径是/user/hive/warehouse/*.db。

5010
cwl_java

快速学习-DML数据操作

(1)load data:表示加载数据 (2)local:表示从本地加载数据到 hive 表;否则从 HDFS 加载数据到 hive 表 (3)inpath:...

4610
cwl_java

快速学习-Hive函数

1)Hive 自带了一些函数,比如:max/min 等,但是数量有限,自己可以通过自定义 UDF来方便的扩展。 2)当 Hive 提供的内置函数无法满足你的业...

5510
cwl_java

快速学习-Hive查询

https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Select 查询语句语法:

5020
cwl_java

快速学习-Azkaban概述

Azkaban 是由 Linkedin 公司推出的一个批量工作流任务调度器,主要用于在一个工作流内以一个特定的顺序运行一组工作和流程,它的配置是通过简单的 ke...

5620
cwl_java

快速学习-Azkaban实战

注意: 目前,Azkaban 上传的工作流文件只支持 xxx.zip 文件。zip 应包含 xxx.job 运行作业所需的文件和任何文件(文件名后缀必须以.j...

6020
cwl_java

快速学习-Flume企业开发案例

在job文件夹下创建Flume Agent配置文件flume-telnet-logger.conf。 [atguigu@hadoop102 job]$ tou...

6710
cwl_java

大数据-sqoop数据迁移

sqoop是apache旗下一款“Hadoop和关系数据库服务器之间传送数据”的工具。

5410
cwl_java

大数据-Azkaban实战

创建文本文件,更改名称为mycommand.job 注意后缀.txt一定不要带上,保存为格式为UFT-8 without bom 内容如下

6420
cwl_java

大数据-Azkaban介绍

各任务单元之间存在时间先后及前后依赖关系, 为了很好地组织起这样的复杂执行计划, 需要一个工作流调度系统来调度执行;

10420
cwl_java

大数据-Hive的安装

这里我们选用hive的版本是3.1.0这个release版本,可以兼容我们对应的hadoop3.x的版本

7420
cwl_java

大数据-Hive的基本概念

Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类 SQL查询功能。

7110
cwl_java

大数据-UDF开发实例

4810
cwl_java

大数据-Hive内置函数与自定义函数

5800
cwl_java

大数据-Hive联表语句

左外连接:JOIN操作符左边表中符合WHERE子句的所有记录将会被返回。 查询老师对应的课程

4900

扫码关注云+社区

领取腾讯云代金券