首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

hive学习笔记——Hive创建

——2015.07.28 一、Hive概述         Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据,并提供类似于SQL(HiveSQL)的操作功能。...Hive的基本操作与传统的数据库的操作类似,所不同的是Hive的SQL语句会转换成MapReduce程序执行,对于特定的查询等操作,具有更高的性能。...这部分的笔记是假设已经搭建好Hive以及Hadoop集群,主要精力放在对Hive以及Hadoop的基本操作上。 二、Hive的基本操作之DDL 1、启动Hive Hive ?...当出现hive>就表示已经进入Hive环境,此时可以进行Hive的基本操作。 2、建立Hive 格式: ?...3、查看Hive的信息 describe ? 4、查看分区信息 show partitions table_name 5、删除 drop table table_name ?

1.6K20

hive学习笔记——Hive创建

——2015.07.28 一、Hive概述         Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据,并提供类似于SQL(HiveSQL)的操作功能。...Hive的基本操作与传统的数据库的操作类似,所不同的是Hive的SQL语句会转换成MapReduce程序执行,对于特定的查询等操作,具有更高的性能。...这部分的笔记是假设已经搭建好Hive以及Hadoop集群,主要精力放在对Hive以及Hadoop的基本操作上。 二、Hive的基本操作之DDL 1、启动Hive Hive ?...当出现hive>就表示已经进入Hive环境,此时可以进行Hive的基本操作。 2、建立Hive 格式: ?...3、查看Hive的信息 describe ? 4、查看分区信息 show partitions table_name 5、删除 drop table table_name ?

4.2K30
您找到你想要的搜索结果了吗?
是的
没有找到

Hive 创建外部

创建外部 create external table if not exists stocks_external( ymd date, price_open float, price_high float...删除 -- 删除外部 drop table stocks_external; -- 查看 hdfs 上的数据,删除外部是只删除的元数据,不删除的实际数据,这点和 hdfs dfs -ls /user.../bigdata 最后归纳一下Hive中表与外部的区别:   1、在导入数据到外部,数据并没有移动到自己的数据仓库目录下,也就是说外部中的数据并不是由它自己来管理的!...而则不一样;   2、在删除的时候,Hive将会把属于的元数据和数据全部删掉;而删除外部的时候,Hive仅仅删除外部的元数据,数据是不会删除的!   那么,应该如何选择使用哪种呢?...但是作为一个经验,如果所有处理都需要由Hive完成,那么你应该创建,否则使用外部

1.8K30

大数据-Hive创建语法

Hive 操作 1.1....Hive创建语法 CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_name data_type [COMMENT col_comment...EXTERNAL关键字可以让用户创建一个外部,在建的同时指定一个指向实际数据的路径(LOCATION), Hive 创建内部时,会将数据移动到数据仓库指向的路径;若创建外部,仅记录数据所在的路径...在建的时候,用户还需要为指定列,用户在指定的列的同时也会指 定自定义的 SerDe,Hive通过 SerDe 确定的具体的列的数据。 ....CLUSTERED BY 对于每一个(table)或者分区, Hive可以进一步组织成桶,也就是说桶是更为细粒度的数据范围划分。Hive也 是 针对某一列进行桶的组织。

58920

Hive如何创建elasticsearch外部

外部Hive提供了一种外部的功能,外部只需要与数据存储位置上的现有数据建立关联,无需将数据移动至Hive存储库中进行存储,即可使用外部数据源。...创建外部只需在创建时使用 `EXTERNAL` 关键字指定的类型。在以下样例中:我们在'LOCATION'参数指定了外部数据的存储位置。Hive 将使用该位置中的数据来填充外部。...Hive强大且完善的类SQL能力,我们可以在Hive中通过创建elasticsearch外部的方式来实现对elasticsearch集群数据的查询。...创建方式如下:CREATE EXTERNAL TABLE IF NOT EXISTS ods.hive_elastic_table_test ( user_id string,country string...弹性扩展:通过Hive创建elasticsearch外部,可以将elasticsearch 的数据与其他数据源进行联合查询。

53121

Hive 中内部与外部的区别与创建方法

先来说下Hive中内部与外部的区别: Hive 创建内部时,会将数据移动到数据仓库指向的路径;若创建外部,仅记录数据所在的路径, 不对数据的位置做任何改变。...下面来看下 Hive 如何创建内部: create table test(userid string); LOAD DATA INPATH '/tmp/result/20121213' INTO...test add partition (ptDate='20121214') location '/tmp/result/20121214'; -- 注意目录20121214最后不要画蛇添足加 /*,我就是linux...name string) ROW FORMAT DELIMITED FIELDS TERMINATED BY ‘\t’ LOCATION ‘/sunwg/test08′; 上面的语句创建了一张名字为...在当前用户hive的根目录下找不到sunwg_test09文件夹。 此时hive将该的数据文件信息保存到metadata数据库中。

2.5K90

Hive创建时添加中文注释后乱码问题

创建数据时我们经验会添加一些中文注释到表里面方便识别,最近在测试Hive的时候,发现添在Hive创建时添加COMMENT时的中文注释就会出现乱码,如下: 解压思路:...登陆Mysql数据库切换到Hive库: use hive  修改以下两张即可; alter table COLUMNS_V2 modify column COMMENT varchar(256) character...查看表结构时就正常显示中文了; 如果你的创建了分区的话就要再加一条语句: alter table PARTITION_KEYS modify column PKEY_COMMENT varchar(...hive版本来修改:【修改一个文件即可】 进入目录: cd hive/scripts/metastore/upgrade/mysql  因为我使用的hive是2.0.0版本,所以就修改这个文件:hive-schema... NULL,  修改成:  `PKEY_COMMENT` varchar(4000) CHARACTER SET utf8 DEFAULT NULL,  最后修改完后就执行上面的初始化元数据,再创建时就可以看到正常显示中文了

81441

Hive 基本操作(创建数据库与创建数据库)

二、Hive基本操作 2.1、创建数据库与创建数据库 创建数据库操作 创建数据库 create database if not exists myhive; use myhive; ?...说明:hive存放位置模式是由hive-site.xml当中的一个属性指定的 hive.metastore.warehouse.dir /user/hive/...2、EXTERNAL关键字可以让用户创建一个外部,在建的同时指定一个指向实际数据的路径(LOCATION),Hive 创建内部时,会将数据移动到数据仓库指向的路径; 若创建外部,仅记录数据所在的路径...需求,创建hive对应的,并将数据加载到中,进行数据统计分析,且删除之后,数据不能删除 需求实现: 数据准备: hdfs dfs -mkdir -p /scoredatas/month=201806...from '/export/techer'; hive中的数据导出(了解) 将hive中的数据导出到其他任意目录,例如linux本地磁盘,例如hdfs,例如mysql等等 insert导出

4.7K50

HIve内部外部概念

外部(external table) 有external修饰,数据保存在HDFS上,该位置由用户指定。删除时,只会删除的元数据,所以外部不是由Hive完全管理的 ---- 2....内部(internal table/managed table) 没有external修饰,数据保存在Hive默认的路径下,数据完全由Hive管理,删除时元数据和数据都会一起删除。...外部数据由HDFS管理,Hive管理外部元数据,尔内部数据和元数据都由Hive管理 2....外部数据存储位置由用户指定,而内部的数据默认存储位置为/apps/hive/warehouse/数据库名.db/数据文件名 3....希望做数据备份并且不经常改变的数据,存放在外部可以减少失误操作 2. 数据清洗转换后的中间结果,可以存放在内部,因为Hive对内部支持的功能比较全面,方便管理 3.

86410

Hive 内部与外部

托管(内部)和外部Hive中的两种不同类型的,在这篇文章中,我们将讨论Hive中表的类型以及它们之间的差异以及如何创建这些以及何时将这些用于特定的数据集。 1....内部 托管(Managed TABLE)也称为内部(Internal TABLE)。这是Hive中的默认。当我们在Hive创建一个,没有指定为外部时,默认情况下我们创建的是一个内部。...如果我们创建一个内部,那么将在HDFS中的特定位置创建。默认情况下,数据将在HDFS的/usr/hive/warehouse目录中创建。...Hive创建一个都会在hive.metastore.warehouse.dir指向的目录下以创建一个文件夹,所有属于这个的数据都存放在这个文件夹里面/user/hive/warehouse/tb_station_coordinate...Hive不管理数据和权限设置以及目录等,需要你有另一个程序或过程来做这些事情 不是基于现有(AS SELECT)来创建 可以创建并使用相同的模式并指向数据的位置

3.3K20

扫码

添加站长 进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

    运营活动

    活动名称
    广告关闭
    领券