专栏首页Hadoop实操如何在Hive中使用Struct类型

如何在Hive中使用Struct类型

温馨提示:如果使用电脑查看图片不清晰,可以使用手机打开文章单击文中的图片放大查看高清原图。

Fayson的github: https://github.com/fayson/cdhproject

提示:代码块部分可以左右滑动查看噢

1.文档编写目的


Hive中支持多种数据类型除了常用的TINYINT、SMALLINT、INT、BIGINT、BOOLEAN、FLOAT、DOUBLE、STRING、BINARY、TIMESTAMP、DECIMAL、DATE、VARCHAR、CHAR类型外,当然还包含一些复杂的数据类型(array、map、struct、union)。本篇文章Fayson主要介绍在Hive中使用Struct类型存储数据。

  • 内容概述

1.环境准备

2.创建Hive表及测试

3.总结

  • 测试环境

1.CM和CDH版本为5.15

2.环境准备


准备测试数据,文本数据内容如下:

0098.HK,104,2018-10-21T22:20:00.105Z,fayson:男:18
0098.HK,104,2018-10-21T22:20:00.105Z,fayson1:男:19
0098.HK,104,2018-10-21T22:20:00.105Z,fayson2:男:20
0098.HK,104,2018-10-21T22:20:00.105Z,fayson3:男:21
0098.HK,104,2018-10-21T22:20:00.105Z,fayson4:男:22

(可左右滑动)

将准备好的测试数据保存到test.csv文件中,并上传至HDFS的/mdtick/hk/csv目录下。

[root@cdh03 ~]# cat test.csv
[root@cdh03 ~]# hadoop fs -put test.csv /mdtick/hk/csv/
[root@cdh03 ~]# hadoop fs -ls /mdtick/hk/csv/
[root@cdh03 ~]# hadoop fs -cat /mdtick/hk/csv/test.csv

(可左右滑动)

3.创建Hive表


1.使用如下SQL语句创建一个包含Struct类型的表

CREATE EXTERNAL TABLE csvtable2(
    symbol string,
    tickSequence string,
    timeStamp string,
    tickdata struct<
        name: string,
        sex: string,
        age: int
    >
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ','
collection items terminated by ":"
STORED AS TEXTFILE
LOCATION '/mdtick/hk/csv';

(可左右滑动)

如上SQL建表语句中需要注意的是,Struct类型里面定义的为字段的名称与数据类型。Struct类型中定义的字段与示例数据中的“fayson:男:18”是按顺序对应起来的。Collection items terminated by “:”,表示Struct类型数据以“:”分割。

2.使用Hue在Hive中创建测试表

3.使用SQL命令查看csvtable2表数据

4.使用SQL语句查看Struct中数据

4.总结


1.在Hive表中定义Struct类型数据,即在Struct中指定相应的字段名及数据类型即可,多个字段以逗号分隔。

2.使用SQL语句查询Struct中数据方式跟普通的指定字段名方式一样,无需对数据进行特殊处理即可。

3.Struct同样也支持其它类型数据的嵌套,如下:

struct<info:Map<String,String>>

struct<info: struct<name:string>>等

提示:代码块部分可以左右滑动查看噢

为天地立心,为生民立命,为往圣继绝学,为万世开太平。 温馨提示:如果使用电脑查看图片不清晰,可以使用手机打开文章单击文中的图片放大查看高清原图。

推荐关注Hadoop实操,第一时间,分享更多Hadoop干货,欢迎转发和分享

本文分享自微信公众号 - Hadoop实操(gh_c4c535955d0f)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-10-31

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 如何在Hive中使用Map类型

    在前面的文章Fayson介绍了《Hive创建外部表CSV数据中列含有逗号问题处理》。本篇文章Fayson主要介绍在Hive中使用Map类型存储数据。

    Fayson
  • Hive与Impala的关键字

    Hive有一些保留的关键字,我们在执行一些语句时,不能将这些关键字作为标识符(Identifier),比如建表语句的表名或者字段名,以下我们具体看看什么是Hiv...

    Fayson
  • 如何使用Lily HBase Indexer对HBase中的数据在Solr中建立索引

    Fayson
  • 【重温经典】MIT人工智能实验室: 如何做研究?丨附下载

    并没有什么神丹妙药可以保证在研究中取得成功,本文只是列举了一些可能会有所帮助的非正式意见。

    数据猿
  • 【经典】MIT人工智能实验室: 如何做研究?

    【导读】本文来自于MIT的人工智能实验室,创作于1988,虽然有30多年,但作为新进硕士博士研究生的参考,写的绝对精辟,奉为经典。中文译本由北京师范大学信息学院...

    zenRRan
  • 【收藏】2万字超长干货,如何做研究?

    https://dspace.mit.edu/bitstream/handle/1721.1/41487/AI_WP_316.pdf

    yuquanle
  • 经典收藏!MIT人工智能实验室:如何做研究?

    导读:本文来自于MIT的人工智能实验室,创作于1988。虽然已有30多年,但本文作为新进硕士博士研究生的参考,绝对精辟,奉为经典。尤其当下做AI更需要重温。中文...

    华章科技
  • 学界丨这届机器学习论文评比,搞怪无厘头我只服 Reddit

    你知道吗?Reddit 上的 Machine Learning 小组上目前已经聚集了 85,613 位关注者了,而在 2016 年底的时候,@Mandratha...

    AI科技评论
  • 如何云化你的 Windows 应用?

    AWS AppStream是一项新的亚马逊服务,它可实现Windows应用的云化,可将操作系统扩展至各种计算机和移动设备。今天,服务最实用的用例是将提供简单的游...

    静一
  • Quora:暮光之城女主角文章毫无价值,算不上人工智能论文

    【新智元导读】1月20日,国外多家媒体报道,暮光之城女主角 Kristen Stewart 发表了一篇关于图像风格迁移的人工智能论文,引起业内广泛讨论。不少人感...

    新智元

扫码关注云+社区

领取腾讯云代金券

玩转腾讯云 有奖征文活动