前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Hive基本操作

Hive基本操作

作者头像
z小赵
发布2018-09-05 15:31:01
3920
发布2018-09-05 15:31:01
举报
文章被收录于专栏:简单聊聊Spark简单聊聊Spark

1.使用SQL文件创建一张表:

hive  -f  create_table

2.将外部数据加载到一张表里面:

LOAD DATA LOCAL INPATH  '/usr/local/src/mr_wordcount/hive_test/a.txt'  OVERWRITE INTO TABLE  u_info;

3.两张表作join操作:

select a.*,b.* from w_a a join w_b b on a.userid = b.userid;

4.从hdfs上导入数据到hive上:

LOAD DATA INPATH '/test.txt'  OVERWRITE INTO TABLE u_info;

5.从一张已知表中选择部分数据插入到一个空表中:

insert into table u_info select * from w_a limit 3;

6.创建一张新表并将已知表中的部分数据插入到新建的这张表中:

create table u_info as select * from w_a;

7.将数据从hive上导出到本地:

insert overwrite local directory  '/usr/local/src/wc_input/a.txt' select * from w_a;

8.将数据从hive上导出到hdfs上:

insert overwrite directory '/a.txt' select * from w_a;

9.在hive中创建一张表的时候,同时为某一个字段指定为partition,这里其实还是创建了一个有三个字段的表,只是username被当作partition掉了而已:

create table w_a ( userid         STRING, password     STRING ) PARTITION BY (dt STRING) ROW FORMAT DELEMITED FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n';

执行数据插入操作:

LOAD DATA LOCAL INPATH '/usr/local/src/a_log.txt' OVERWRITE INTO TABLE w_a partition(dt='20170303');

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2017.10.02 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档