原创

Hive

Hive

运行方式

命令行

脚本

jdbc

webui

搭建模式

local

单用户模式

远程模式/多用户模式

一般模式

Beeline

· 服务器hiveserver2启动

· 客户端beeline连接

HQL

建表(create)

内部表

· hive管理,删除表时源数据消失

外部表

· 非hive管理,删除表时源数据不消失

查看表描述(desc)

DML

和sql基本类似,用到查询即可

分区

静态分区

动态分区

分桶

适用场景

抽样

map-join

索引

提高检索性能

SerDe

用于序列化与反序列化

构建数据存储和执行引擎之间用于解耦

用于hive和hbase的交互中

JDBC

默认端口10000

Hive函数

内置函数

自定义函数

继承udf或者udaf

重写evaluate方法

参数

配置文件

set命令

hive cli时设置(一次性)

Lateral View

解决多个udaf的使用问题

视图

和关系型数据库类似,相当与建立子查询,不过只有调用视图的时候才会使用

权限管理

元数据信息需要连接mysql存储

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 【Hive】Hive介绍及Hive环境搭建

    版权声明:本文为博主原创文章,转载请注明出处。 https://blog.csdn.net/...

    魏晓蕾
  • Hive

    Hive是Hadoop生态系统中比不可少的一个工具,它提供了一种SQL(结构化查询语言)方言,可以查询存储在Hadoop分布式文件系统(HDFS)中的数据或其他...

    week
  • Hive

    由facebook开源的用于解决海量结构化日志的数据统计,后称Apache Hive 的开源项目。

    可爱见见
  • 【Hive】Hive 的基本认识

    Hive 是由 Facebook 开源的基于 Hadoop 的数据仓库工具,用于解决海量「结构化日志」的数据统计。

    阿泽 Crz
  • Hive篇--搭建Hive集群

    Hive中搭建分为三中方式 a)内嵌Derby方式 b)Local方式 c)Remote方式 三种方式归根到底就是元数据的存储位置不一样。

    LhWorld哥陪你聊算法
  • Hive篇---Hive与Hbase整合

    Hive会经常和Hbase结合使用,把Hbase作为Hive的存储路径,所以Hive整合Hbase尤其重要。

    LhWorld哥陪你聊算法
  • Hive篇---Hive使用优化

    本节主要描述Hive的优化使用,Hive的优化着重强调一个 把Hive SQL 当做Mapreduce程序去优化 二.主要优化点

    LhWorld哥陪你聊算法
  • Missing Hive Execution Jar: /.../hive-exec-*.jar

    运行hive时显示Missing Hive Execution Jar: /usr/hive/hive-0.11.0/bin/lib/hive-exec-*....

    闵开慧
  • Hive Tips Hive使用技巧

    http://blog.sina.com.cn/s/blog_6a7df1f1010197d2.html 在Hive中,某些小技巧可以让我们的Job执行得更快,...

    Albert陈凯
  • hive(2)——hive基本操作

    前提:开启hadoop,关闭safe模式(关闭safe模式命令:hdfs dfsadmin -safemode leave) (1)创建一个数据库hive_t...

    gzq大数据
  • Hive架构及Hive On Spark

    (1)Table:每个表都对应在HDFS中的目录下,数据是经过序列化后存储在该目录中。同时Hive也支持表中的数据存储在其他类型的文件系统中,如NFS或本地文件...

    用户3003813
  • 【Hive】Hive 的内置函数

    这篇文章主要介绍 Hive 的一些内置函数,其目的在于了解和知道大概有哪些内置函数,以及我们能够做哪些操作。

    阿泽 Crz
  • Hadoop——Hive

    官方地址http://hive.apache.org/ 简单,容易上手提供了类似SQL查询语言HQL 为超大数据集设计的计算、存储拓展能力 统一的元数据管...

    羊羽shine
  • Apache Hive

    Apache Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供一种HQL语言进行查询,具有扩展性好、延展性好、高容...

    大数据学习与分享
  • hive bucket

    hive中table可以拆分成partition, table和partition可以通过CLUSTERED BY 进一步分bucket,bucket中的数据...

    sparkle123
  • hive之路7-hive之DDL操作

    在Hive中,数据库是一个命名空间或表的集合。创建了数据库之后,在HDFS上的存储路径默认为/usr/hive/warehouse/*.db具体语法为:

    皮大大
  • hive之路5-hive数据类型

    它支持传统的UNIX时间戳可选纳秒的精度。它支持的java.sql.Timestamp格式YYYY-MM-DD HH:MM:SS.fffffffff和格式YYY...

    皮大大
  • hive学习笔记——Hive表的创建

    初衷:以前看过Hadoop方面的材料,但是一直以来都是与实际应用脱轨,现在有机会接触到真正的Hadoop集群,还是被他的性能所震撼,利用这个机会认真重新学习下...

    zhaozhiyong
  • hive学习笔记——Hive表的创建

    初衷:以前看过Hadoop方面的材料,但是一直以来都是与实际应用脱轨,现在有机会接触到真正的Hadoop集群,还是被他的性能所震撼,利用这个机会认真重新学习下...

    zhaozhiyong

扫码关注云+社区

领取腾讯云代金券