首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Hive操作二(管理、外部、分区

Hive操作二(管理、外部、分区) *管理 --我们目前所创建的都是管理,也叫内部 --Hive会控制管理数据的生命周期,Hive默认会将数据存储在/user.../hive/warehouse子目录下 --删除一个管理时,Hive也会删除这个中数据 --管理不方便和其他工具共享数据 eg:我们有一份由Pig...这个是外部,LOCATION告诉Hive数据位于哪个路径下 2.因为是外部,所以Hive并非认为其完全拥有这份数据,删除该时并不会删除这份数据,只会删除描述的元数据信息 *管理...) 注:如果语句省略 EXTERNAL 关键字而源是外部的话,那么生成的新也是外部 如果语句省略 EXTERNAL 关键字而源管理的话,那么生成的新也是管理...如果语句有EXTERNAL关键字而源管理的话,那么生成的新是外部 *分区管理 --管理和外部都可以加分区 eg:CREATE TABLE IF NOT

87510

如何使用Sentry管理Hive外部(补充)

1.文档编写目的 ---- 本文文档主要讲述如何使用Sentry管理Hive/Impala外部权限。...数据库对student_hive操作 可以向中插入数据 0: jdbc:hive2://localhost:10000/> insert into student_hive values('lisi...-31-6-148 ~]$ 测试总结: hive创建的外部,通过Sentry授权后,fayson用户组使用beeline和Hue能对该进行查询和插入操作。...5.测试总结 ---- 如果这个外部的目录没有在cm里配置成需要sentry管理的目录,通过Sentry赋权后,是没法做ACL同步的,不建议在生产系统中这样使用。...如果你需要管理外部,那么你就需要按照之前的标准文档来操作。如何使用Sentry管理Hive外部权限 醉酒鞭名马,少年多浮夸! 岭南浣溪沙,呕吐酒肆下!挚友不肯放,数据玩的花!

1.2K40
您找到你想要的搜索结果了吗?
是的
没有找到

如何使用Sentry管理Hive外部权限

1.文档编写目的 本文档主要讲述如何使用Sentry对Hive外部权限管理,并基于以下假设: 1.操作系统版本:RedHat6.5 2.CM版本:CM 5.11.1 3.集群已启用Kerberos和Sentry...4.采用具有sudo权限的ec2-user用户进行操作 2.前置准备 2.1创建外部数据父目录 1.使用hive用户登录Kerberos [root@ip-172-31-8-141 1874-hive-HIVESERVER2...3.创建Hive外部 1.使用beeline命令行连接hive,创建Hive外部 建表语句: create external table if not exists student(...5.为fayson用户赋予student读权限 注:以下操作均在hive管理员用户下操作 1.创建student_read角色 0: jdbc:hive2://localhost:10000/> create...7.Sentry管理Hive外部权限总结 开启外部的数据父目录ACL同步后,不需要单独的维护外部数据目录权限。

5.2K91

HIVE外部管理区别以及INSERT INTOINSERT OVERWRITE区别

很多同学在Hive开发过程中,都会遇到外部管理的问题,而且在联合使用insert into 和 insert overwrite 时,总是理不清。...Hive管理与外部的区别: 1、在导入数据到外部,数据并没有移动到自己的数据仓库目录下,也就是说外部中的数据并不是由它自己来管理的!...而管理则不一样; 2、在删除管理的时候,Hive将会把属于的元数据和数据全部删掉;而删除外部的时候,Hive仅仅删除外部的元数据,数据是不会删除的!...分区不删除数据 另外提下,如果对管理应用此操作,21号数据会被替换成15号数据,21号数据会被删除。...这个操作对于外部管理结果是一样的,原因是因为针对hive,insert overwrite将会把分区数据先删除再进行插入。

1.8K20

hive学习笔记——Hive的创建

——2015.07.28 一、Hive概述         Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据,并提供类似于SQL(HiveSQL)的操作功能。...Hive的基本操作与传统的数据库的操作类似,所不同的是Hive的SQL语句会转换成MapReduce程序执行,对于特定的查询等操作,具有更高的性能。...这部分的笔记是假设已经搭建好Hive以及Hadoop集群,主要精力放在对Hive以及Hadoop的基本操作上。 二、Hive的基本操作之DDL 1、启动Hive Hive ?...当出现hive>就表示已经进入Hive环境,此时可以进行Hive的基本操作。 2、建立Hive 格式: ?...3、查看Hive的信息 describe ? 4、查看分区信息 show partitions table_name 5、删除 drop table table_name ?

1.3K20

Hive 内部与外部

托管(内部)和外部Hive中的两种不同类型的,在这篇文章中,我们将讨论Hive中表的类型以及它们之间的差异以及如何创建这些以及何时将这些用于特定的数据集。 1....内部 托管(Managed TABLE)也称为内部(Internal TABLE)。这是Hive中的默认。当我们在Hive中创建一个,没有指定为外部时,默认情况下我们创建的是一个内部。...Hive每创建一个都会在hive.metastore.warehouse.dir指向的目录下以名创建一个文件夹,所有属于这个的数据都存放在这个文件夹里面/user/hive/warehouse/tb_station_coordinate...使用场景 3.1 内部 数据是临时的 希望使用Hive管理和数据的生命周期 删除后不想要数据 3.2 外部 这些数据也在Hive之外使用。...Hive管理数据和权限设置以及目录等,需要你有另一个程序或过程来做这些事情 不是基于现有(AS SELECT)来创建的 可以创建并使用相同的模式并指向数据的位置

3.1K20

HIve内部外部概念

外部(external table) 有external修饰,数据保存在HDFS上,该位置由用户指定。删除时,只会删除的元数据,所以外部不是由Hive完全管理的 ---- 2....内部(internal table/managed table) 没有external修饰,数据保存在Hive默认的路径下,数据完全由Hive管理,删除时元数据和数据都会一起删除。...外部数据由HDFS管理Hive管理外部元数据,尔内部数据和元数据都由Hive管理 2....外部数据存储位置由用户指定,而内部的数据默认存储位置为/apps/hive/warehouse/数据库名.db/数据文件名 3....希望做数据备份并且不经常改变的数据,存放在外部可以减少失误操作 2. 数据清洗转换后的中间结果,可以存放在内部,因为Hive对内部支持的功能比较全面,方便管理 3.

74910

hive学习笔记——Hive的创建

——2015.07.28 一、Hive概述         Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据,并提供类似于SQL(HiveSQL)的操作功能。...Hive的基本操作与传统的数据库的操作类似,所不同的是Hive的SQL语句会转换成MapReduce程序执行,对于特定的查询等操作,具有更高的性能。...这部分的笔记是假设已经搭建好Hive以及Hadoop集群,主要精力放在对Hive以及Hadoop的基本操作上。 二、Hive的基本操作之DDL 1、启动Hive Hive ?...当出现hive>就表示已经进入Hive环境,此时可以进行Hive的基本操作。 2、建立Hive 格式: ?...3、查看Hive的信息 describe ? 4、查看分区信息 show partitions table_name 5、删除 drop table table_name ?

4.1K30

Hive操作一

Hive操作一 *文本文件 -CSV:以逗号分隔的文本文件 -TSV:以制表符分隔的文本文件 这两种文件格式Hive都支持,但是有个缺点就是用户要对文本文件中那些不需要作为分隔符处理的逗号或者制表符格外小心...2.增加 IF NOT EXISTS,若存在,Hive会忽略后面的建表语句,而且不会有提示,所以第一次建 IF NOT EXISTS 会有用 3.但需要注意是的,如果已存在的和这个模式不一样...,Hive不会做出提示,如果要用新模式需删除原,然后重新建。...但defult库是个例外,他在/user/hive/warehouse下没有对应库目录,所以defult库中的目录直接位于/user/hive/warehouse目录后(明确指定例外) *拷贝(...table3 --不在该库下列举该库下的所有 eg:hive >USE default; hive > SHOW

1.1K30
领券