首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Hive 基本操作(创建数据库创建数据库表)

二、Hive基本操作 2.1、创建数据库创建数据库创建数据库操作 创建数据库 create database if not exists myhive; use myhive; ?...warehouse 创建数据库并指定hdfs存储位置 create database myhive2 location '/myhive2'; 修改数据库 可以使用alter database...但是数据库的元数据信息是不可更改的,包括数据库的名称以及数据库所在的位置 修改数据库创建日期 alter database myhive2 set dbproperties('createtime...cascade; 不要执行(危险动作) 创建数据库表操作 创建数据库表语法 CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name...2、EXTERNAL关键字可以让用户创建一个外部表,在建表的同时指定一个指向实际数据的路径(LOCATION),Hive 创建内部表时,会将数据移动到数据仓库指向的路径; 若创建外部表,仅记录数据所在的路径

4.5K50
您找到你想要的搜索结果了吗?
是的
没有找到

hive学习笔记——Hive表的创建

——2015.07.28 一、Hive概述         Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据表,并提供类似于SQL(HiveSQL)的操作功能。...在Hive中,本质上是将SQL转换成为MapReduce程序。...Hive的基本操作与传统的数据库的操作类似,所不同的是Hive的SQL语句会转换成MapReduce程序执行,对于特定的查询等操作,具有更高的性能。...这部分的笔记是假设已经搭建好Hive以及Hadoop集群,主要精力放在对Hive以及Hadoop的基本操作上。 二、Hive表的基本操作之DDL 1、启动Hive Hive ?...当出现hive>就表示已经进入Hive环境,此时可以进行Hive的基本操作。 2、建立Hive表 格式: ?

4.1K30

Hive3创建和管理分区

动态创建分区 您可以将Hive配置为动态创建分区,然后运行查询以在文件系统或对象存储上创建相关目录。Hive然后将数据分离到目录中。...创建分区表后,Hive不会更新有关您添加或删除的文件系统上相应对象或目录的元数据。添加或删除相应的对象/目录后,Hive元存储中的分区元数据变得陈旧。您需要同步元存储和文件系统。...在外部分区表中,创建表时默认情况下启用此属性(true)。对于旧版外部表(使用不支持此功能的Hive版本创建),您需要添加discover.partitions到表属性中以启用分区发现。...1.假设您使用不支持分区发现的Hive版本创建了一个外部表,请对该表启用分区发现。...如果您指定分区元数据保留期,则Hive会将元数据和相应的数据删除到保留期之后创建的任何分区中。

1.3K20

Hive 创建自定义函数(UDF)

Hive中的内置函数不满足我们需求的时候,我们可以自定义我们自己的Hive函数,来满足我们的需求。 下面介绍一下Hive创建自定义函数的过程。...需要创建一个类继承UDF,重写方法evaluate package com.example.hive.udf; import org.apache.hadoop.hive.ql.exec.UDF; import...== null) { return null; } return new Text(s.toString().toLowerCase()); } } 编译代码为一个jar,然后将这个jar添加到Hive...的classpath中 --添加jar hive> add jar /tmp/my_jar.jar; --查看该Hive会话中添加的jar hive> list jars; 从Hive0.13开始,我们也可以在创建函数的时候...,直接指定jar的位置 hive> CREATE FUNCTION myfunc AS 'myclass' USING JAR 'hdfs:///path/to/jar'; 在Hive中注册你的函数 create

3.1K10

Hive与传统数据库对比

由于Hive采用了SQL的查询语言HQL,因此很容易将Hive理解为数据库。其实从结构上来看,Hive数据库除了拥有类似的查询语言,再无类似之处。...数据库可以用在Online的应用中,但是Hive是为数据仓库而设计的,清楚这一点,有助于从应用角度理解Hive的特性。...数据库中,通常会针对一个或者几个列建立索引,因此对于少量的特定条件的数据的访问,数据库可以有很高的效率,较低的延迟。由于数据的访问延迟较高,决定了 Hive不适合在线数据查询。...总结:hive具有sql数据库的外表,但应用场景完全不同,hive只适合用来做批量数据统计分析 Hive的数据存储 1、Hive中所有的数据都存储在 HDFS 中,没有专门的数据存储格式(可支持Text...,SequenceFile,ParquetFile,ORC格式RCFILE等) 2、只需要在创建表的时候告诉 Hive 数据中的列分隔符和行分隔符,Hive 就可以解析数据。

1.6K10

hive 底层与数据库交互原理

Hive 的查询功能是由 hdfs 和 mapreduce 结合起来实现的,对于大规模数据查询还是不建议在 hive 中,因为过大数据量会造成查询十分缓慢。...Hive 与 mysql 的关系:只是借用 mysql 来存储 hive 中的表的元数据信息,称为 metastore. 1)用户接口主要有三个:CLI,Client 和 WUI。...其中最常用的是CLI,Cli启动的时候,会同时启动一个Hive副本。Client是Hive的客户端, 用户连接至Hive Server。...在启动 Client模式的时候,需要指出Hive Server所在节点,并且在该节点启动Hive Server。 WUI是通过浏览器访问Hive。...2)Hive将元数据存储在数据库中,如mysql、derby。 Hive中的元数据包括表的名字,表的列和分区及其属性,表的属性(是否为外部表等),表的数据所在目录等。

1K50
领券