如何在Hive中使用Map类型

温馨提示:如果使用电脑查看图片不清晰,可以使用手机打开文章单击文中的图片放大查看高清原图。

Fayson的github: https://github.com/fayson/cdhproject

提示:代码块部分可以左右滑动查看噢

1.文档编写目的


在前面的文章Fayson介绍了《Hive创建外部表CSV数据中列含有逗号问题处理》。本篇文章Fayson主要介绍在Hive中使用Map类型存储数据。

内容概述

1.环境准备

2.创建Hive表及测试

3.总结

  • 测试环境

1.CM和CDH版本为5.15

2.环境准备


准备测试数据,文本数据内容如下:

0098.HK,104,2018-10-21T22:20:00.105Z,name:fayson|sex:男|age:18
0098.HK,104,2018-10-21T22:20:00.105Z,name:fayson1|sex:男|age:19
0098.HK,104,2018-10-21T22:20:00.105Z,name:fayson2|sex:男|age:20
0098.HK,104,2018-10-21T22:20:00.105Z,name:fayson3|sex:男|age:21
0098.HK,104,2018-10-21T22:20:00.105Z,name:fayson4|sex:男|age:22

将准备好的测试数据保存到test.csv文件中,并上传至HDFS的/mdtick/hk/csv目录下。

[root@cdh03 ~]# cat test.csv
[root@cdh03 ~]# hadoop fs -put test.csv /mdtick/hk/csv/
[root@cdh03 ~]# hadoop fs -ls /mdtick/hk/csv/
[root@cdh03 ~]# hadoop fs -cat /mdtick/hk/csv/test.csv

(可左右滑动)

3.创建Hive表


1.使用如下SQL语句创建一个包含Map类型的表

CREATE EXTERNAL TABLE csvtable2(
    symbol string,
    tickSequence string,
    timeStamp string,
    tickdata MAP<String, string>
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ','
COLLECTION ITEMS TERMINATED BY '|'
MAP KEYS TERMINATED BY ":"
STORED AS TEXTFILE
LOCATION '/mdtick/hk/csv';

(可左右滑动)

如上SQL建表语句中需要注意的是,Map类型里面定义了Key和Value的数据类型。Map类型中定义的字段与示例数据中的“name:fayson|sex:男|age:18”,该数据以k-v方式存储。Collection items terminated by “|”,表示Map中每个kv直接以”|”分割,MAP KEYS TERMINATED BY ":",表示kv之间数据以“:”分割。

2.使用Hue在Hive中创建测试表

3.使用SQL命令查看csvtable2表数据

4.使用SQL语句查看Map中数据

select symbol,ticksequence,tickdata['name'], tickdata['sex'], tickdata['age'] from csvtable2;

(可左右滑动)

4.总结


1.在Hive表中定义Map类型数据,Map只能以K-V的方式定义一批数据的数据类型,与Struct相比对每个字段的类型定义没有那么灵活。

2.使用SQL语句查询Map中数据时需要指定查询字段的key。

3.同样Map也是支持嵌套数据格式Map<String,<Struct>>等。

提示:代码块部分可以左右滑动查看噢

为天地立心,为生民立命,为往圣继绝学,为万世开太平。 温馨提示:如果使用电脑查看图片不清晰,可以使用手机打开文章单击文中的图片放大查看高清原图。

推荐关注Hadoop实操,第一时间,分享更多Hadoop干货,欢迎转发和分享。

本文分享自微信公众号 - Hadoop实操(gh_c4c535955d0f)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-10-30

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏青青天空树

趣味题:恺撒Caesar密码(c++实现)

描述:Julius Caesar 生活在充满危险和阴谋的年代。为了生存,他首次发明了密码,用于军队的消息传递。假设你是Caesar 军团中的一名军官,需要把Ca...

9320
来自专栏haifeiWu与他朋友们的专栏

I-team 博客全文检索 Elasticsearch 实战

一直觉得博客缺点东西,最近还是发现了,当博客慢慢多起来的时候想要找一篇之前写的博客很是麻烦,于是作为后端开发的楼主觉得自己动手丰衣足食,也就有了这次博客全文检索...

41110
来自专栏Android 研究

Android系统启动——5 zyogte进程(Java篇)

上一篇文章,我们知道在AndroidRuntime.cpp的start()函数里面是调用的Zygoteinit类的main()函数,那我们就继续研究

33920
来自专栏yukong的小专栏

【SpringBoot2.0系列05】SpringBoot之整合Mybatis前言实现

【SpringBoot2.0系列02】SpringBoot之使用Thymeleaf视图模板

29320
来自专栏Hadoop实操

如何使用Java代码访问HDFS.docx

在开发Hadoop应用时,需要用到hadoop-client API来访问HDFS并进行本地调试。本篇文章则主要讲述如何使用Java代码访问Kerberos和非...

74570
来自专栏杂烩

websocket 原

     WebSocket protocol 是HTML5一种新的协议。它实现了浏览器与服务器全双工通信(full-duplex)。   

21220
来自专栏逸鹏说道

模块式开发

这两天看到同事的一个小工具,用的是模块式开发,也就是俗称的插件开发,用的是反射+接口的方式实现的。感觉挺好的,也就学习了一下,写个小Demo,在此记录下。 一、...

37660
来自专栏Spark学习技巧

Spark源码系列之spark2.2的StructuredStreaming使用及源码介绍

一,概述 Structured Streaming是一个可扩展和容错的流处理引擎,并且是构建于sparksql引擎之上。你可以用处理静态数据的方式去处理你的流计...

1.4K70
来自专栏Hadoop实操

如何通过Livy的RESTful API接口向Kerberos环境的CDH集群提交作业

在前面的文章Fayson介绍了《Livy,基于Apache Spark的开源REST服务,加入Cloudera Labs》、《如何编译Livy并在非Kerber...

1.8K110
来自专栏hotqin888的专栏

engineercms利用pdf.js制作连续看图功能

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/hotqin888/article/det...

21010

扫码关注云+社区

领取腾讯云代金券